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Verfahren zum Infonnationsaustausch in einera 
Mehrprozessorsystem 

Die Erfindung betrifft ein Mehrprozessorsystem 
5 mit einem Hauptspeicher, Verarbeitungs-Prozessoren und den 
Verarbei tungs - Prozessoren zugeordne te Cache - Speicher . S ie 
erstreckt sich weiterhin auf ein Verfahren zum 
Infonnationsaustausch zwischen einem Hauptspeicher und 
Verarbeitungs- Prozessoren fiber den jedem dieser 

10 Prozessoren zugeordneten Cache-Speicher . Ihr Ziel ist auch 
ein neues integriertes Schaltkreisbauteil, mit dem das 
> Mehrprozessorsystem ausgerCtstet werden kann. 

Es ist bekannt, dafi in den gebr^uchlichsten 
Mehrprozessorsystemen alle Informationen (Daten, Adressen) 

15 zwischen dem Hauptspeicher und den verschiedenen 
Verarbeitungs -Prozessoren durch einen gemeinsamen 
parallelen Koramunikationsbus fibertragen werden, der einen 
EngpaE bildet: seine Ubertragungsrate ist in der Tat nicht 
ausreichend, um alle Prozessoren bei voller Leistung von 

20 einem gemeinsamen Hauptspeicher aus zu versorgen. 

Um die fibertragungsrate der Informationen zu 
erhdhen, besteht eine erste Losung darin, jedem 
Verarbeitungs -Prozessor einen Cache-Speicher zuzuordnen, 
der durch die Lage der Information eine Verringerung der 
) 25 Anforderungen an den Hauptspeicher erm6glicht. 1st das 
Volumen der zwischen den Prozessoren geteilten Daten 
jedoch betrtchtlich, dann erzeugt die Auf rechterhaltung 
der KohSxenz der Daten zwischen den Speichern einen 
zusatzlichen Informationsverkehr auf dem 

30 Kommunikationsbus , was sich einer bedeutenden Verringerung 
der globalen Datenrate auf diesem Bus entgegenstellt, und 
diese Losung somit einen grofien Teil ihres Interesses 
einbuEt . 

Eine andere L6sung besteht darin, den 
35 Koramunikationsbus in Form eines vermaschten Netzes, 
"crossbar" genannt, auszufuhren, was eine direkte 
Kommunikation zwischen jedem Verarbeitungs -Prozessor und 
jeder Unterbaugruppe des Hauptspeichers (Speicherbank) 
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ermdglicht. Jedoch ist diese L6sung in der Ausfuhrung 
aufgrund der sehr hohen Anzahl von Querverbindungen sehr 
schwerfallig und sehr kostspielig, und sie wird vollkommen 
unrealistisch, wenn die Anzahl der Verarbeitungs- 
5 Prozessoren zehn ubersteigt. Aufierdem impliziert eine 
solche Losung im Falle vielfacher Anf orderungen von 
mehreren Prozessoren an eine selbe Speicherbank 
Zugriffskonflikte, die eine Quelle von 

Austauschverzogerungen darstellen. 

10 Eine andere, aufgrund der Einfachheit ihrer 

Architektur gangigere Losung besteht darin, jedem 
Verarbeitungs-Prozessor einen Lokalspeicher zuzuordnen, um 
die ihn betreffenden Daten zu speichern und um die 
geteilten Daten in dem gemeinsamen Hauptspeicher zu 

15 speichern. Jedoch besteht der groSe Nachteil dieser 
Architektur in ihrer mangelnden Transparenz, das heiJSt in 
der Notwendigkeit fur den Programme rer, die Zuordnungen 
der Daten in die verschiedenen Speicher im Detail zu 
organisieren, und zwar in dem MaSe, daS die Anwendung 

20 dieser Ldsung ausgesprochen einengend ist. AuSerdem kann 
sie, im Pall eines hohen Volumens geteilter Daten, wie im 
vorhergenden Fall zu einer Sattigung des Busses fur den 
Zugriff auf den Hauptspeicher fuhren. 

Im ubrigen wurde von der Berkeley -Universit&t 

25 eine sogenannte "aquarius Architektur" vorgeschlagen, die 
darin besteht, die oben genannte Crossbar -Losung dadurch 
zu verbessern, daS einerseits, was die nicht geteilten 
Daten betrifft, an das Crossbar-Netz angeschlossene Cache- 
Speicher und andererseits, was die geteilten Daten 

30 betrifft, andere, an einen gemeinsamen Synchronisationsbus 
angeschlossene Cache- Speicher rait dem Crossbar-Netz 
kombiniert werden. Diese Losung bringt eine schnellere 
Austausch-Geschwindigkeit, bleibt aber sehr schwerfallig 
und sehr kostspielig in der Ausfuhrung. 

35 Die vorliegende Erfindung mochte eine neue 

Losung lief era, die es ermoglicht, die 

Informationsaustauschraten betrachtlich zu erhohen, und 
zwar unter Wahrung einer fur den Benutzer transparenten 
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Architektur, die sehr viel einfacher . ist, als die 
Crossbar-Architektur . 

Bin Ziel der Erfindung ist somit, eine 
merkliche Erhohung der Anzahl der Verarbeitungs- 
5 Prozessoren des Systems zu ennoglichen, wobei ein hoher 
Wirkungsgrad fur jeden Prozessor ausgenutzt wird. 

Ein anderes Ziel ist es, eine Struktur eines 
integrierten Schaltkreisbauteils zu liefern, die eine sehr 
einfache Durchfuhrung der Architektur dieses neuen 

10 Mehrprozessorsystems ermdglicht. 

Zu diesem Zweck enthSlt das von der Erfindung 
angestrebte Mehrprozessorsystem einen Hauptspeicher (RAM) , 
der in Inf ormationsbl&cken (bi) angeordnet ist, 
Verarbeitungs -Prozessoren (CPUx ... CPUj ... CPU n ) , einen 

15 Cache- Speicher (MCj), der mit jedem Verarbeitungs - 
Prozessor (CPUj) verbunden und in Inf ormationsblocken (bi) 
angeordnet ist, die genauso groS sind, wie die des 
Hauptspeichers, ein Verzeichnis (RGj) und dessen 
Verwaltungsprozessor (PGj), die beide jedem Cache -Speicher 

20 (MCj) zugeordnet sind, Mittel ftir die tibertragung der 
Blockadressen zwischen Prozessoren (CPUj) und 
Hauptspeicher (RAM) ; erf indungsgem&fc ist das besagte 
Mehrprozessorsystem ausgestattet mit: 

mehreren Schieberegistern, sogenannten 

25 Speicher-Schieberegistern (RDM a . . . RDMj . . . RDMJ , wobei 
jedes dieser Register (RDMj) so an den Hauptspeicher (RAM) 
angeschlossen ist, dafi innerhalb eines Zyklus dieses 
Speichers ein paralleler Lese- oder Schreibtransfer eines 
Informationsblocks (bi) zwischen dem besagten Register und 

30 dem besagten Hauptspeicher moglich ist, 

Schieberegistern, sogenannten Prozessor - 
Schieberegistern (RDPj . . . RDPj . . . RDP n ) , wobei jedes 
Prozessor-Schieberegister (RDPj) so xnit dem Cache- Speicher 
(MCj) eines Prozessors (CPUj) verbunden ist, dafi ein 

35 paralleler Lese- oder Schreibtransfer eines 
Informationsblocks (bi) zwischen dem besagten 
Schieberegister (toPj) und dem besagten Cache -Speicher 
(MCj) moglich ist, 
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. mehreren Serieiiverbindungen (LS X ... LSj, 
... LS n ) , wobei jede ein Speicher-Schieberegister (RDMj) 
mit einem Prozessor-Schieberegister (RDPj) verbindet und 
geeignet ist, den Transfer von Infonnationsbl6cken (bi) 
5 zwischen den beiden betreffenden Registern (RDMj, RDPj) zu 
ermSglichen. 

So erfolgt in dem erf indungsgemafcen 
Mehrprozessor system der Austausch zwischen Cache-Speichern 
und zugeordneten Prozessoren wie in den herkommlichen, mit 

10 Cache- Speichem ausgestatteten Systemen. Im Gegensatz 
dazu, erfolgt der Austausch zwischen Hauptspeicher und 
Cache -Speichem gSnzlich neuartig. 

Jeder Tranfer eines Informationsblocks (bi) 
vom Hauptspeicher (RAM) zum Cache -Speicher (MCj) eines 

15 gegebenen Prozessors (CPUj) besteht darin: 

. innerhalb eines Zyklus des Hauptspeichers 
den Block (bi) des besagten Hauptspeichers (RAM) zum 
Speicher-Schieberegister (RDMj) (von der Grofie eines 
Blocks) zu ubertragen, das direkt an den Hauptspeicher 

20 angeschlossen ist und das dem betreffenden Prozessor 
(CPUj) entspricht, 

auf der entsprechenden Serienverbindung 
(LSj) den Inhalt dieses Speicher- Schieberegisters (RDMj) 
zum Prozessor-Schieberegister (RDPj) (von der gleichen 

25 KapazitSt) zu ubertragen, das dem Cache-Speicher (MCj) des 
betreffenden Prozessors (CPUj) zugeordnet ist, 

den Inhalt. des besagten Prozessor- 
Schieberegisters (RDPj) zu dem besagten Cache-Speicher 
(MCj) zu ubertragen. 

30 In der entgegengesetzten Richtung besteht 

jeder Transfer eines Inf ormationsblocks (bi) vom Cache- 
Speicher (MCj) eines gegebenen Prozessors (CPUj) zum 
Hauptspeicher (RAM) darin: 

. den Block *(bi) von dem besagten betreffenden 

35 Cache-Speicher (MCj) zum Prozessor-Schieberegister (RDPj) 
zu ubertragen, das dem besagten Cache-Speicher (MCj) 
zugeordnet ist, 
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. den Inhalt des Prozessor-Schieberegisters 
(RDPj ) auf der entsprechenden Serienverbindung (LSj) zum 
Speicher-Schieberegister (RDMj) zu Cibertragen, das dem 
betreffenden Prozessor zugeordnet ist . (von alien 
5 Schieberegistern (RDM a . . - RDMj . . • RDM n ) , die an den 
Hauptspeicher (RAM) angeschlossen sind) , 

. den Inhalt des Speicher-Schieberegisters 
(RDMj) innerhalb eines 2yklus des Hauptspeichers zu dem 
besagten Hauptspeicher (RAM) zu iibertragen. 
10 Unter diesen Bedingungen erfolgt der Transfer 

aller Informationsbldcke (bi) nicht mehr durch einen 
; parallelen Bus, wie es bei den bekannten Systemen der Fall 
ist, sondern uber Serienverbindungen mit einer hohen 
Ubertragungsgeschwindigkeit . Diese Serienverbindungen 
15 ermoglichen . Transferdauern eines Blocks (bi) , die 
vergleichbar sind mit den Transferdauern in den bekannten 
Systemen mit parallelem Bus Oder sogar geringer, als 
diese. Das unten gegebene vergleichende Beispiel mit fur 
die aktuelle Technologie gangigen Parameterwerten zeigt 
20 klar und deutlich diese paradox erscheinende Tatsache. 

Es wird davon ausgegangen, daS jeder 
Informationsblock (bi) 64 Byte groS ist. 

In dem erf indungsgemafien System teilt sich die 
Transferdauer zwischen dem Hauptspeicher und einem Cache- 
» 25 Speicher auf in: 

eine Hauptspeicher (RAM) /Speicher- 
Schieberegister (RDMj) -Transferdauer: 100 Nanosekunden 
(Leistung eines gSngigen Hauptspeichers mit 
Zufallsreihenf olgezugrif f ) , 

30 * eine Serientransferdauer auf der 

entsprechenden Serienverbindung: 64 x 8 x 1/500. 10 6 , das 
sind 1 024 Nanosekunden, wobei eine Translerf requenz von 
500 Megahertz angenommen wird (was bei den aktuellen 
Technologien, die Frequenzen bis zu 3 000 Megahertz 

35 zulassen, nicht aufiergew6hnlich ist) , 

- eine Prozessor-Schieberegister (RDPj) /Cache- 
Speicher (MCj) -Transferdauer : 50 Nanosekunden (sehr 
gangiger Cache- Speicher) . 
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Die gesamte Transferdauer eines Blocks betrfigt 
somit circa 1 200 Nanosekunden (wobei zweitrangige 
Verkettungs-Zeiten in Betracht gezogen werden) . 

Bei den bekannten Systemen mit Cache- 
5 Speichern, bei denen der Inf ormationsaustausch direkt 
parallel durch 4-Byte-W6rter erfolgt (die gingigsten 
Systeme, die zu gewohnlichen Bussen mit 32 Datendrdhten 
fuhren) , ist die Transferdauer eines Blocks gleich der 
Transferdauer der 16 4-Byte-W6rter, aus denen dieser Block 

10 besteht, das heifit: 16 x 100 = 1 600 Nanosekunden. 

Man sieht also, dafi diese Zeiten, bei 
durchschnittlichen Annahmen filr beide Losungen, 
vergleichbar sind. Beira Vergleich der Architektur des 
erfindungsgem&fien Systems mit der mit einem parallelen 

15 gemeinsamen Bus mit Cache -Speichern (die erste . zuvor 
genannte Ldsung) stellt man jedoch fest, dafi: 

bei der herkSramlichen Ldsung (gemeinsamer 
paralleler Bus) der Hauptspeicher und der gemeinsame Bus 
wahrend des Transfers zu 100 % belegt sind, da zwischen 

20 den beiden wahrend der gesamten Transferdauer 
Infonnationen ausgetauscht werden, 

bei dem erf indungsgeraSfien System die 
Serienverbindung wahrend des Transfers zu 100 % belegt 
ist, der Hauptspeicher jedoch zu weniger als 10 % der 

25 Transferdauer belegt ist (Lese-Dauer des Speichers und 
Lade-Dauer des Speicher-Schieberegisters (RDMj) ) , so daS 
der Hauptspeicher 10 mal mehr Prozessoren bedienen kann, 
als im vorhergehenden Fall (wobei die Belegung der 
Serienverbindung ohne Bedeutung ist, da sie privat und dem 

30 Prozessor zugeordnet ist) . 

Es mufi im ixbrigen hervorgehoben werden, dafi in 
dem erf indungsgem£fien System jede Serienverbindung, die 
jeden einzelnen Prozessor mit dem Hauptspeicher verbindet, 
eine einfache Verbindung ist (mit einem oder zwei 

35 Datendrahten) , sodafi das so gebildete Seriennetz von der 
Komplexit&t her zum Beispiel nicht mit einem Crossbar-Netz 
vergleichbar ist', bei dem jede Verbindung eine 
Parallelverbindung mit einer Vielzahl von Drahten ' (32 
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Datendr&hte bei dem vorgenannten vergleichenden Beispiel) 
mit alien notwendigen Schaltern ist. 

Aufierdem besitzt das erf indungsgem££e System, 
wie man spSter auf den vergleichenden Kurven sehen wird, 
5 deutlich verbesserte Leistungen im Vergleich zu den 
traditionellen Systemen mit einem geme ins amen Bus und 
ermoglicht in der Praxis den Einsatz einer sehr viel 
hoheren Anzahl von Verarbeitungs-Prozessoren (von mehreren 
zebn bis zu circa hundert Prozessoren) ; diese Leistungen 
10 sind kompatibel mit denen eines Crossbar-Systems, doch 
besitzt das erf indungsgemafie System eine sehr viel 
} einfachere Architektur. 

Bei dem erf indungsgemafien System kann jede 
Serienverbindung praktisch entweder mittels zweier 
15 unidirektionaler Seriendrahte fur einen bit-ftir-bit- 
Transfer durchgefuhrt werden oder mittels eines einzigen 
bidirektionalen Drahts. 

Im ersten Fall wird jedes Speicher- 
Schieberegister (RDMj) und jedes Prozessor-Schieberegister 
20 (RDPj) in zwei Register aufgeteilt, das eine ist auf den 
Transfer in die eine Richtung, das andere auf den Transfer 
in die andere Richtung spezialisiert. Die beiden 
unidirektionalen Seriendrahte werden dann so an das 
aufgeteilEe Speicher-Schieberegister (RDMj) und . das 
1 25 entsprechende aufgeteilte Prozessor-Schieberegister (RDPj) 
angeschlossen, da& das eine den Transfer in die eine 
Richtung und das andere den Transfer in die andere 
Richtung erm&glicht. 

Diese Art der Durchfuhrung mit zwei 
30 unidirektionalen Drahten bietet den Vorteil, da£ keine 
Transferverwaltung auf den DrShten notwendig ist, jedoch 
besteht der Nachteil, dafi die notwendigen Betriebsmittel 
(Draht, Register) verdoppelt werden mussen. 

Im zweiten Fall ist eine Freigabelogik der 
35 Transf errichtung dem bidirektionalen Draht so zugeordnet, 
da£ ein wechselnder Transfer in beide Richtungen auf dem 
besagten Draht moglich ist. Diese Logik kann in den 
Verwaltungsprozessor (PGj) # der dem Cache -Speicher (MCj) 



zugeordnet ist und mit dera der besagte bidirektionale 
Draht verbunden ist, integriert werden. 

Selbstverstandlich kann jede Serienverbindung 
gegebenenf alls mit einer hdheren Anzahl von Seriendr&hten 
5 durchgefiihrt werden. 

Bei dem erf indungsgema£en Mehrprozessorsystem 
konnen die Adressen-Ubertragungsmittel ira wesentlichen auf 
zwei Art en ausgefuhrt werden: zunichst konnen sie aus 
einera Bus fur die parallele Obertragung von Blockadressen 

10 (BUSA) bestehen, der derselbe fur alle Prozessoren (CPUj) 
ist und der diese letzteren und den Hauptspeicher (RAM) 
* auf herkommliche Art und Weise mit einem Busarbiter (AB) 
verbindet, der geeignet ist, die Zugriff skonf likte auf den 
besagten Bus zu verwalten. Es mufi bemerkt werden, daS 

15 dieser Adrefibus nur fur die Ubertragung der Blockadressen 
benutzt wird: was die Struktur betrifft, so ist dieser Bus 
mit dem Bus fur die parallele Adrefiubertragung der 
bekannten Systeme, fur den es deshalb keine 
Sattigungsprobleme gibt, da er sofort nach dem Transfer 

20 der Blockadresse freigemacht werden kann, identisch. 

Bs kann bei dem erfindungsgemafien 
Mehrprozessorsystem jedoch noch eine andere 
Durchfuhrungsart dieser Adressen-foertragungsmittel ins 
Auge gefaSt werden; sie besteht darin, die 

25 Serienverbindungen fur den Transfer der Informationsblocke 
(bi) zu nutzen, urn die Adressen dieser Blocke zu 
Qbertragen. 

In diesem Fall wird an jede Serienverbindung 
(LSj) parallel zum entsprechenden Speicher-Schieberegister 

30 (RDMj ) ein zusitzliches Schieberegister {RDCj) 
angeschlossen: die durch die besagte Serienverbindung 
ubertragenen Adressen werden so in jedes dieser 
Zusatzregister (RDCj) geladen; ein mit den besagten 
Registern (RDCj) und dem Hauptspeicher (RAM) verbundener 

35 Zugrif fsverwaltungsarbiter (ABM) ist dann vorgesehen, utn 
die in den besagten Registern befindlichen Adressen zu 
holen und die Zugriff skonf likte zum Hauptspeicher (RAM) zu 
• verwalten. Ein solcher Arbiter ist von der Konzeption her 
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an sich bekannt, und diese Art von Zugrif f skonflikten ist 
seit vielen Jahren gelost. Bei dieser Durchfuhrungsart 
wird zwar ein paralleler Adrefibus vermieden, jedoch sind 
die verwaltungsbetriebsmittel mit mehr Aufwand verbunden. 
5 Itq ijbrigexi ist das erf indungsgemaSe 

Mehrprozessorsystem ganz besonders gut geeignet, um auf 
wirkungsvolle Weise die Koharenzprobleme der zwischen 
Verarbeitungs-Prozessoren geteilten Daten zu verwalten. 
TatsSchlich haben die herkommlichen Losungen zur 

10 Verwaltung dieser geteilten Daten bei den bekannten 
Systemen auf grund des Engpasses bei der 
Informationsilbertragung ihre Grenzen, sind jedoch, im 
Gegenteil dazu, bei dem erf indungsgemiBen System, wo ein 
solcher Bngpafi nicht mehr besteht, vollkommen befriedigend 

15 und leistungsfahig, sodafi dieses System mit 
Verwaltungsmitteln fur die geteilten Daten ausgestattet 
werden kann, die mit denen der bekannten Systeme analog 
sind. 

Eine traditionelle Verwaltungsldsung der 
20 geteilten Daten besteht zum Beispiel in der Vermeidung 

ihrer Obertragung durch die Cache -Speicher: auf 

herkommliche Art und Weise ist eine Partitionslogik (LPj) 

jedem Verarbeitungs-Prozessor (CPUj) zugeordnet, um die 

Adressen der geteilten Daten und die der nicht geteilten 
25 Daten zu unterscheiden, und zwar, um die erst en direkt zum 

Hauptspeicher (RAM) und die zweiten zum entsprechenden 

Ca che -Spei cher (MCj) zu leiten. 

Bei einer ersten erf indungsgem2£en 

Architekturversion umfaEt das System: 
30 - einen speziellen parallelen 

Wor tuber tragungsbus (BUSD) , der die Prozessoren (CPUj) und 

den Hauptspeicher (RAM) verbindet, 

eine jedem Prozessor (CPUj) zugeordnete 

Partitionslogik (LPj), die geeignet ist, die Adressen der 
35 geteilten Daten und die der nicht geteilten Daten zu 

unterscheiden, um diese auf den Adresen-Ubertragunsmitteln 

mit ihrer Identif izierung zu ubertragen, 



10 



eine dem Hauptspeicher (RAM) zugeordnete 
Decodierungslogik (DEC), die geeignet ist, die Adressen 
mit ihrer Identif izierung zu empfangen und die Daten am 
Speicherausgang weiterzuleiten, entweder, was die 
5 nichtgeteilten Daten betrifft, zum entsprechenden 
Speicher-Schieberegister (RDMj) oder, was die geteilten 
Daten betrifft, zu dera speziellen Wortubertragungsbus 
(BUSD) . 

Diese Losung hat den Vorteil, daS sie 

10 architekturmafcig sehr einfach ist: das Vorhandensein des 
speziellen parallelen Wortubertragungsbus ses (BUSD) fuhrt 
zu besseren Leistungen im Vergleich zu einer Losung, die 
darin best&nde, die Serienverbindungen zu benutzen, urn 
nicht nur die B16cke von nicht geteilten Daten, sondern 

15 auch die Worter von geteilten Daten zu ubertragen. Es mufi 
angemerkt werden, dafi diese letzte Losung gegebeneafalls 
bei einem schwachen Volumen von geteilten Daten ins Auge 
gefa&t werden kann. 

Bei einer anderen Version ist das System mit 

20 einem speziellen parallelen Wortubertragungsbus (BUSD) und 
einem speziellen gemeinsamen Bus filr die Ubertragung der 
Wortadressen (BUS AM) ausgestattet, die die Prozessoren 
(CPUj) mit dem Hauptspeicher (RAM) verbinden. Die 
Partitionslogik (LPj) leitet die Adressen der geteilten 

25 Daten zu dem speziellen gemeinsamen Bus (BUSAM) fur den 
Datentransfer durch den speziellen Wortbus (BUSD) und 
leitet die nicht geteilten Daten zu den Adressen- 
Ubertragungsmitteln (unabhangig davon, ob diese aus einem 
parallelen Ubertragungsbus bestehen oder ob die 

30 Ubertragung uber die Serienverbindungen erfolgt) . 

Das Vorhandensein eines speziellen Busses fur 
die Ubertragung von Wortadressen erm6glicht bei dieser 
Version, im Falle hoher Anforderungeri nach geteilten 
Daten, die S&ttigungsgrenze der Adressen- 

35 Ubertragungsmittel herabzusetzen. 

Eine andere Version, die in der Praxis dort 
vorzuziehen ist, 'wo die Adressen-Ubertragungsmittel aus 
einem parallelen Adrefcbus (BUSA) bestehen, besteht darin, 
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das System rait einem dem Speicher (RAM) zugeordneten 
Speicher- Verwaltungsprozessor (PGM) und rait einem jedem 
Verarbeitungs-Prozessor (CPUj) und dem entsprechenden 
Verwaltungsverzeichnis (RGj) zugeordneten Busspion- 
5 Prozessor (PEj) auszustatten; der Speicher- 
Verwaltungsprozessor (PGM) und jeder Busspion-Prozessor 
(PEj) - von der Struktur her an sich bekannt - sind an den 
Adrefibus (BUSA) angeschlossen, um die auf dem besagten Bus 
ubertragenen Blockadressen zu Qberwachen beziehungsweise 

10 zu verarbeiten, und zwar so, dafi ein Update des 
Hauptspeichers (RAM) und des zugeordneten Cache-Speichers 
(MCj) bei Entdecken einer in dem zugeordneten Verzeichnis 
(RGj) vorhandenen Blockadresse moglich ist. 

Der Speicher- Verwaltungsprozessor (PGM) und 

15 jeder Spion-Prozessor (PEj) ordnen jedem Inf ormationsblock 
Zustandsbits zu, aktualisieren diese je nach Art (Lesen 
oder Schreiben) der Blockanforderungen, die auf dem Bus 
(BUSA) llbertragen werden, und sorgen fftr die KohSrenz der 
geteilten Daten, indem sie diese Zustandsbits benutzen, 

20 die es ihnen ermoglichen, das Schreiben eines Blocks im 
Moment der Anforderungen auf dem Bus (BUSA) in den 
Hauptspeicher zu erzwingen oder nicht. 

In dem vorgenannten Fall, bei dem die 
Adressenubertragung uber die Serienverbindungen erfolgt, 

25 konnen die geteilten Daten auch zentral verwaltet werden, 
und zwar durch einen dem Hauptspeicher (RAM) zugeordneten 
Speicher- Verwaltungsprozessor (PGM) und einen jedem 
Verarbeitungs-Prozessor (CPUj) und dem entsprechenden 
Verwaltungsverzeichnis (RGj) zugeordneten Prozessor zur 

30 Aufrechterhaltung der Koharenz der geteilten Daten (PMCj), 
wobei jeder Prozessor zur Aufrechterhaltung der KohoLrenz 
(PMCj) an einen Synchronisationsbus (SYNCHRO) 
angeschlossen ist, der von dem Speicher- 
Verwaltungsprozessor (PGM) so . gesteuert wird, dafi ein 

35 Update des Hauptspeichers (RAM) und des zugeordneten 
Cache-Speichers (MCj) bei Entdecken einer Blockadresse 
sowie ein Update dies Hauptspeichers (RAM) und der Cache- 
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Speiclier (MCj) bei jeder Entnahme von Adressen aus den 
Zusatzschieberegistern (RDCj) raoglich ist. 

Wie zuvor sorgen Zustandsbits , die durch den 
Prozessor (PGM) jedem Inforraationsblock zugeordnet sind, 
5 fiir dieses Update. 

Es ist anzumerken, da£ in der vorhergehenden 
Architektur, bei der die Blockadressen auf einem 
gemeinsamen AdreSbus (BUSA) ubertragen werden, 
gegebenenfalls ein Synchronisationsbus der oben 

10 definierten Art vorgesehen werden kann. In diesem Fall 
werden die Spionprozessoren (PEj) durch den Speicher- 
Verwaltungsprozessor (PGM) tiber den Synchronisationsbus 
beansprucht, dies jedoch nur dann, wenn sie von dem 
Transfer betroffen sind. So werden flberflfissige Zugriffe 

15 auf die Cache -Speicher vermieden; die Spionprozessoren 
werden dann passiv (da sie von dem Prozessor PGM 
beansprucht werden) und sie werden daher geraifi der oben 
benutzten Terminologie besser durch den angemesseneren 
Ausdruck "Prozessor zur Auf rechterhaltung der KohcLrenz" 

20 bezeichnet. 

Eine andere Losung besteht darin, den 
parallelen AdreSbus (BUSA) dem Transfer der Blockadressen 
von geteilten Daten vorzubehalten und die 
Serienverbindungen ftilf den Transfer der Blocke der nicht 
25 geteilten Daten zu benutzen. 

Im ubrigen ist das erf indungsgemafce 
Mehrprozessorsystera fiir Gruppen von Verarbeitungs- 
Prozessoren auf ein und derselben Serienverbindung 
geeignet, soda£ die Anzahl der notwendigen 
30 Serienverbindungen und die der entsprechenden Speicher- 
Schieberegister (RDMj) beschr&ikt wird. 

Die Anzahl der Speicher-Schieberegister (RDMj) 
kann der Anzahl der Serienverbindungen (LSj) entsprechen; 
in diesem Fall wird jedes Speicher-Schieberegister (RDMj) 
35 statisch an eine Serienverbindung (LSj), die spezifisch zu 
dem besagten Register gehort, angeschlossen. 

Die Anzahl der Speicher-Schieberegister (RDMj) 
kann auch von der der Serienverbindungen ' (LSj) 
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verschieden, insbesondere niedriger sein; in. diesera Fall 
werden diese Register durch ein Verbundnetz dynamisch an 
die Serienverbindungen (LSj) angeschlossen. 

Wie bei den herk6tttmlichen Systemen kann der 
5 Hauptspeicher {RAM) in m parallel angeordnete 
Speicherbanken (RAM 2 ... RAM p . RAM^) unterteilt werden. 
Jedes Speicher-Schieberegister (RDMj) besteht dann aus m 
elementaren Registern (RDMj X ... RDMj p ... RDMj m ) , die 
parallel mit der entsprechenden Serienverbindung {LSj) 

10 verbunden sind. Jedoch wird ein zusStzlicher 
Parallelit£tsgrad und eine bessere elektrische Oder 
optische Anpassung der Verbindung bei einer Variante 
erreicht, bei der jede Speiche.rbank RAMp . durch eine Punkt 
zu Punkt -Serienverbindung LSj p mit jedera Prozessor CPUj 

15 verbunden ist. 

Im ubrigen wird, um eine Transf erleistung zu 
erreichen, die wenigstens genauso groB ist, wie die der 
herkommlichen Systeme mit Parallelbus, das 
erf indungsgemaBe System vorzugsweise durch einen Taktgeber 

20 synchronisiert , dessen Frequenz F wenigstens 100 Megahertz 
betr&gt. Die Speicher-Schieberegister (RDMj) und 
Prozessor-Schieberegister (RDPj) k6nnen ganz einfach von 
einem Typ sein, der fur eine Schiebef reguenz von 
wenigstens F geeignet ist. 

25 Im Fall sehr hoher Frequenzen (bei der 

aktuellen Technologie insbesondere hoher als 500 
Megahertz) k&nnen diese Register in Unterregister von 
einer schw£cheren Schiebef requenz unterteilt und 
multiplexiert werden. 

30 Die Erfindung erstreckt sich weiterhin auf ein 

Serienmultiport-Speicherbauteil, das dazu dient, das zuvor 
definierte Mehrprozessorsystem auszurusten, um deren 
Herstellung zu vereinf achen. Dieses Bauteil, das im 
ubrigen verschiedene Anwendungen haben kann, besteht aus 

35 einem integrierten Schaltkreis, der einen Speicher mit 
Zufallsreihenfolgezugriff (RAM) von einer zuvor 
festgelegten GroSe umfafct, die einem Inf ormationsblock 
(bi) entspricht, mehreren Schieberegistern (RDMi . . . RDMj 
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. . • RDMn) , wobei jedes Register eine der Grofie des 
Speichers entsprechende Kapazit&t aufweist, einem internen 
parallelen Bus (BUSI) , der den Zugang des Speichers und 
die Schieberegister verbindet, einer Logik zur Auswahl 
5 eines Schieberegisters (LSR) , die geeignet ist, die 
Verbindung auf dem internen Bus zwischen dem Speicher und 
einem zuvor bestimmten Schieberegister freizugeben und 
mehreren externen Eingangs-/Ausgangsstif ten fiir die 
Adresseneingabe in den Speicher (RAM) , far die 

10 Adresseneingabe zu der Auswahllogik (LSR) , fiir die Eingabe 
und die Preigabe von Transferbefehlen zum Lesen oder 
Schreiben eines Informationsblocks (bi) zwischen dem 
Speicher (RAM) und den Schieberegistero - (RDMj) , fur die 
Eingabe eines Taktgebersignals zu jedem Schieberegister 

15 (RDMj), fiir die bit-filr-bit-Eingabe eines 

Informationsblocks (bi) zu jedem Schieberegister (RDMj) 
und fur die bit- fur-bit -Ausgabe eines Informationsblocks 
aus jedem Schieberegister (RDMj) . 

Dieses Bauteil kann durch Hinzufugen von 

20 Konf igurationsregistern . (RC X/ RC 2 , . ..) parametrierbar 
gemacht werden, die insbesondere die Wahl der Gr6£e der 
Infonnationsblocke (bi) und verschiedener Betriebsmodi der 
Schieberegister ermoglichen. 

Die in ihrer allgemeinen Form dargestellte 

25 Erfindung wird durch die folgende Beschreibung 
illustriert, die sich auf die im Anhang befindlichen 
Zeichnungen bezieht; diese Zeichnungen stellen in einer 
nicht beschrankten Weise mehrere Durchfuhrungsarten dar; 
auf diesen Zeichnungen, die einen wesentlichen Teil der 

30 vorliegenden Beschreibung darstellen: 

- ist Abbildung 1 ein synoptisches Schema 
einer ersten Durchfuhrungsart des erf indungsgemiSen 
Mehrprozessorsystems , 

ist Abbildung 2 ein Diagramm, das ' die 

35 errechnete Leistungskurve dieses Systems (A) zeigt und zum 
Vergleich dazu die entsprechende Kurve (B) fur eine 
konventionelle Mehrprozessor-Architektur mit einem 
gemeinsamen Bus, 
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- sind die Abbildungen 3, 4 und. 5 detaillierte 
logische Schemata funktioneller Einheiten des Systems der 
Abbildung 1, 

- 1st Abbildung 6 ein synoptisches Schema 
5 einer anderen Durchfuhrungsart des Systems, 

- ist Abbildung 7 ein synoptisches Schema 
eines Systems desselben Typs, wie in Abbildung 1, das rait 
Verwaltungmitteln der geteilten Daten ausgestattet ist, 

- ist Abbildung 8 ein logisches Schema, ein 
10 Detail einer Unterbaugruppe des Systems der Abbildung 7, 

- ist Abbildung 9 ein synoptisches Schema 
* eines zu Abbildung 7 analogen Systems mit einer Variante 

bezuglich der Verwaltungmittel von geteilten Daten, 

- ist Abbildung 10 ein synoptisches Schema 
15 eines analogen Systems, das mit unterschiedlichen 

verwaltungsmitteln von geteilten Daten ausgestattet ist, 

- sind die Abbildungen 11, 12a, 12b, 12c, 12d, 
13, 14, 15, 16 und 17 detaillierte logische Schemata 
funktioneller Einheiten des Prozessorsystems der Abbildung 

20 10, 

- ist Abbildung 18 ein synoptisches Schema 
eines Systems desselben Typs, wie in Abbildung 6, das mit 
Verwaltungsmitteln von geteilten Daten ausgestattet ist, 

ist Abbildung 19 ein vereinfachtes 
: 25 synoptisches Schema einer Systemvariante, bei der sich 
raehrere Zentraleinheiten denselben Seriendraht teilen, 

- ist Abbildung 20a ein. synoptisches Schema 
einer bevorzugten Durchfdhrungsart, bei der der 
Hauptspeicher in mehrere Speicherbanken angeordnet ist, 

30 - ist Abbildung 20b eine Variante der in 

Abbildung 20a dargestellten Architektur, 

- schematisieren die Abbildungen 2la und 21b 
eine andere RAM-Speicherstruktur, mit der das besagte 
System ausgerustet werden kann, 

35 - ist Abbildung 22 ein synoptisches Schema, 

das die Struktur eines Serienmultiport-Speicherbauteils 
darstellt, mit dem'das System ausgerustet werden kann. 
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Die in Abbildung l in synoptischer Form 
dargestellte Vorrichtung ist ein Mehrprozessorsystem, das 
n Verarbeitungs -Prozessoren CPU 2 ... CPUj ... CPU n 
besitzt. In dieser Abbildung sind zwei Verarbeitungs - 
5 Prozessoren CPU a und CPUj mit ihrer zugeordneten Logik 
dargestellt. Beide Verarbeitungs -Prozessoren sind 
herkdmmlicher Art, zum Beispiel "MOTOROLA 68020" Oder 
"INTEL 80386" ... und Jc6nnen lokale Speicher- und 
periphSre Schnittstellenhilfsmittel haben und mit einer 

10 virtuellen Speichervorrichtung ausgestattet werden. 

Die Vorrichtung umfafit einen Hauptspeicher mit 
Zufallsreihenf olgezugriff RAM, der in herkSmmlicher Art 
mit integrierten SpeicherschaltJcreisen ausgefuhrt ist: 
insbesondere "INTEL" "NEC" "TOSHIBA" ... dynamischer RAM 

15 mit 256 Kbit, .1 Mbit, 4 Mbit ... je nach Anwendung. Dieser 
Speicher ist in Informationsbldcken bO ... bi ... mit der 
festgelegten GroSe t angeordnet (normalerweise 256 Bit bis 
2 Kbit) , und die Zugrif f sf ront des besagten Speichers 
entspricht der Grdfie eines Blocks. 

20 Der Hauptspeicher ist parallel mit n 

Schieberegistern RDM X . . . RDMj . . . RDMjj, sogenannten 
Speicherregistern, verbunden, wobei jedes Speicherregister 
die Grofie t eines Informationsblocks hat; jedes dieser 
Register ist in einer sehr schnellen Tecfcnologie ("ASGA") 

25 ausgefuhrt, und ein Block kann innerhalb eines Zyklus des 
Hauptspeichers RAM geladen und entladen werden. Die Anzahl 
n der Register ist gleich der Anzahl der Prozessoren CPUj. 

Im ilbrigen ist ein Cache-Speicher MCj in einer 
an sich bekannten Art jedem Prozessor CPUj zugeordnet; 

30 jeder Cache-Speicher besteht nach herkdmmlicher Art aus 
einetn Speicher mit schnellem Zugriff und 
Zufallsreihenfolgezugriff von einer itn Verh&ltnis zum 
Hauptspeicher RAM schwachen Kapazitat. Ein Verzeichnis RGj 
und ein Verwaltungsprozessor PGj . sind nach traditioneller 

35 Art mit dem Cache-Speicher und mit dem Verarbeitungs - 
Prozessor verbunden, urn die Inf ormationen, die durch den 
Cache-Speicher hin&urch ubertragen werden, zu verwalten. 
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AuEerdem ist in dem erf indungsgemafien System 
ein Schieberegister RDPj, ein sogenanntes 
Prozessorregister, durch seinen parallelen Port mit jedem 
Cache- Speicher MCj verbunden; die Gr6£e von jedem 
5 Prozessorregister RDPj entspricht der Gr6£e eines Blocks 
bi und die Struktur ist ahnlich der eines 
Speicherregisters RDMj . 

Jedes Speicherregister RDMj ist durch seinen 
Serienport mit dem Serienport eines Prozessorregisters 

10 RDPj durch eine Serienverbindung LSj verbunden. 
Durchfuhrungsbeispiele dieser Serienverbindung, die einen 
bidirektionalen Draht Oder zwei unidirektionale DreLhte 
umfassen kann 4 sind in den Abbildungen 4 und 5 
dargestellt. Die Trans ferkontrolle der B16cke bi zwischen 

15 entsprechenden. Registern RDMj und RDPj wird durch 
Transferlogiken TFRj und TFR'j durchgefiihrt, die dem 
Speicherregister RDMj und dem Prozessorregister RDPj 
symmetrisch zugeordnet sind; ein Durchfuhrungsbei spiel 
dieser Transferlogiken (an sich herkoinmlicher Art) wird in 

20 Abbildung 3 detailliert dargestellt. 

Der Haupt speicher RAM, die Speicher- 
Schieberegister RDM X ... RDMn und die zugeordneten 
Transferlogiken TFR 1 . . . TFRn bilden zusammen eine 
funktionelle Einheit, 11 Serienraultiport- Speicher" MMS 

25 genannt. Der Verarbeitungs-Prozessor CPUj, der Cache- 
Speicher MCj, das Verwaltungsverzeichnis des Cache- 
Speichers RGj, der Verwaltungsprozessor des Cache- 
Speichers PGj, das Prozessor-Schieberegister RDPj und die 
zugeordnete Transferlogik TFR 1 j bilden zusammen eine 

30 "funktionelle" Einheit, "Zentraleinheit" UCj genannt. 

Im ubrigen umfafit das System Mittel ffcr die 
Ubertragung von Blockadressen von den Prozessoren CPUj zum 
Hauptspeicher RAM, die in dem' Beispiel aus einem 
gemeinsamen parallelen Bus BUSA bestehen, an dem die 

35 Prozessoren CPUj (durch ihren Verwaltungsprozessor PGj) 
und der Hauptspeicher RAM angeschlossen werden. 
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Der Zugriff auf den Bus BUSA wird auf 
herkommliche Art und Weise durch einen Busarbiter AB 
verwaltet . 

Die oben definierte Architektur funktioniert 
5 folgendermaSen : 

Ein Prozessor CPUj fuhrt ein eigenes Programm 
aus, das aus Befehlen besteht, die sich in Wortform im 
Hauptspeicher RAM befinden mit Auszugen in dem 
zugeordneten Cache-Speicher MCj. Auf die Progratnmbef ehle 
10 bin liest der Prozessor CPUj entweder Datenworter, wobei 
sich die Daten selbst im Hauptspeicher RAM oder ±to Cache- 
Speicher MCj in Form von Auszilgen befinden, oder schreibt 
Datenworter in den Hauptspeicher RAM und in den Cache - 
Speicher MCj. 

15 Fur jede Operation eines Prozessors CPUj (als 

"Anforderung" bezeichnet) tnufi die Adresse adr des 
betreffenden Worts, die Art, r oder w der Operation 
(Lesen, Schreiben) und der Austausch (data) des 
betreffenden Worts geliefert werden. 

20 Jede Wort-Anforderung aktiviert den Prozessor 

PGj, der dann auf herkStnmliche Art und Weise das 
Verzeichnis des Cache- Speichers RGj konsultiert, das 
angibt, ob der Block bi, der das betreffende Wort enth&lt, 
im Cache- Speicher MCj vorhanden ist und gegebenenf alls den 

25 Bereich des Blocks im Cache -Speicher, wo sich der gesuchte 
Block befindet. 

Befindet sich der Block bi, der das 
betreffende Wort enthalt, im Cache-Speicher MCj, dann wird 
bei dem Lesevorgang dieses Wort im besagten Cache-Speicher 

30 gelesen und zum Prozessor CPUj gesandt; im Fall des 
Schreibens wird das vora Prozessor CPUj gelieferte Wort in 
den Cache-Speicher geschrieben: die Speichertransaktion 
ist beendet. 

Befindet sich der Block, der das betreffende 
35 Wort enthalt, nicht im Cache-Speicher MCj, dann ist ein 
Lesen des Blocks bi im Hauptspeicher RAM notwendig. Es 
kann zwei F&lle geben. 
Erster Fall 
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Der Cache- Spei cher MCj verftigt Qber wenigstens 
eine freie Blockstelle, die vom Prozessor PGj raittels 
Zustandsbits, die jeder Eingabe des Verzeichnisses RGj 
zugeordnet sind, bestimmt wird. In diesem Fall fragt der 
5 Prozessor PGj auf herkommliche Art und Weise den Bus BUSA 
ab, indem er dem Busarbiter AB seine Anforderung vorlegt. 
Dieser letztere gibt, wenn er an der Reihe ist, den Bus 
BUSA zum Prozessor PGj , der fur den Lesevorgang auf den 
Hauptspeicher RAM Zugriff niramt, und der im Speicher 

10 gelesene Block wird in das Register RDMj geladen, das 
durch die Nummer j des Abfragers identifiziert wird. Das 
Ende des Lesezyklus hat das Freimachen des Busses BUSA und 
die Aktivierung des Transfers tnit der Serienverbindung 
IiSj # was den Transfer des Inhalts des Speicherregisters 

15 RDMj in das Prozessorregister RDPj ermoglicht, zur Folge. 
Das Ende des Transfers aktiviert das Schreiben des Inhalts 
des Prozessorregisters in den Cache-Speicher MCj # und zvar 
an der Blockstelle, die diesem Zweck vorbehalten ist, und 
die Transaktion kann wie zuvor beendet werden. 

20 Zweiter Fall 

Verfugt der Cache-Speicher MCj uber keine 
freie S telle, dann wird durch einen klassischen 
Algorithtmis eine Stelle im Cache-Speicher dazu bestiirant, 
den angeforderten Block zu empfangen. Zwei Situationen 

25 kdnnen auftreten: 

der sich an der bestimmten Stelle 
befindliche Block ist seit seiner Install ierung nicht 
raodifiziert worden: er wird einfach dadurch eliminiert, 
dafi der Bereich des Blocks durch einf aches Schreiben eines 

30 Zustandsbits in das Verzeichnis (RGj) freigemacht wird, 
und dann kann die Transaktion wie zuvor fortgefuhrt 
werden, 

der sich an der bestimmten Stelle 
befindliche Block ist raodif iziert worden, und es ist ein 
35 Update des Haupt spei cher s RAM notwendig. Dazu transferiert 
der Verwaltungsprozessor PGj den bestimmten Block in das 
Prozessorregister 1 RDPj , aktiviert den Transfer vom 
Prozessorregister RDPj in das Speicherregister RDMj und 
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fragt dann den gemeinsamen Bus BUSA ab, indem er dem 
Busarbiter AB seine Anforderung vorlegt. Gibt der Arbiter 
den Bus dem Verwaltungsprozessor PGj, dann aktiviert 
dieser letztere einen Schreibbefehl, wodurch der Inhalt 
5 des Speicherregist ers RDMj an seine Stelle im 
Hauptspeicher RAM iibertragen wird. Das Update des RAM- 
Speichers ist beendet f und die Transaktion kann wie zuvor 
weitergefiihrt werden. 

So erfolgt der Austausch zwischen den 

10 Verarbeitungs-Prozessoren CPUj und ihrem Cache -Speicher 
MCj und zugeordneten Logiken RGj und PGj bei der 
erfindungsgemSSen Vorrichtung, auf herkoramliche Art und 
Weise; im Gegensatz dazu erfolgen die Blocktransfers 
zwischen Hauptspeicher RAM und Cache -Speichern MCj nicht 

15 tnehr uber einen gemeinsamen parallelen Bus, sondern tiber 
Serienverbindungen LSj, die fir jeden Verarbeitungs- 
Prozessor CPUj bestimmt sind, der gemeinsame Bus BUSA 
dient nur zum Transfer der Adressen und hat daher einen 
erheblich niedrigeren Verkehr. 

20 Es ist bekannt, da£ fur die herkftmmlichen 

Architekturen mit einem gemeinsamen Bus eine Modellierung, 
die von "PATEL" untersucht worden ist, (analysis of 
multiprocessors with private cache, JANAK H. PATEL - IEEE 
Transactions on computers vol, C. 31, N° 4 APRIL 1982) zu. 

25 der anndhernden folgenden Fonnel gefuhrt hat, die abhangig 
von der Anzahl der vorhandenen Prozessoren den 
. Wirkungsgrad U angibt: 

U = 1 / 1 + ra (W + tf) 

30 

wobei 

der Wirkungsgrad U die mittlere Nutzungsrate jedes 
Verarbeitungs-Prozessors ist, 

m die Wahrscheinlichkeit ist, dafi ein Verarbeitungs- 
35 Prozessor Daten abfragt, die nicht in seinem Cache- 
Speicher vorhanden sind (diese Wahrscheinlichkeit m = 
alpha. Pa vertialt sich proportional zu der 
Wahrscheinlichkeit des Nichtvorhandenseins Pa der 
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Information in dem Cache- Speicher und zu einem Faktor 
alpha # der abhfingig ist von der Leistung des 
Verarbeitungs-Prozessors, der auf einen Prozentsatz von 
Speicherabf ragen gebracht worden ist) , 
5 W die durchschnittliche Wartezeit des gemeinsamen Busses 
ist i abhangig von der Anzahl n der Prozessoren, 
tf die Transferdauer eines Blocks vom Hauptspeicher in 
einen Cache-Speicher ist. 

Die Annahmen, von denen ausgehend diese Formel 
10 aufgestellt worden ist, zeigen, daS diese auf die 
erfindungsgemalSe Architektur anwendbar ist, mit einem 
Approximationsgrad, der mit dem Approximationsgrad der 
Formel fur klassische Architekturen rait einem gemeinsamen 
Bus vergleichbar ist. 
15 Es ist sorait moglich, die Leistungen der 

beiden Architekturarten zu vergleichen, unter der 
Voraussetzung, daS die Bauteile, die beide Architekturen 
gemein haben, identische Eigenschaf ten haben. 

Abbildung 2 zeigt die Kurven, die man aus dem 
20 von der Anzahl n der Prozessoren abhangigen WirJcungsgrad U 
fur die folgenden Parameter erhSlt, wobei die Parameter, 
die beide Vorrichtungen gemein haben, identisch sind und 
alle tibliche Werte haben: 

GroSe des Blocks bi = 64 Byte, 
25 -GroSe des Worts fur den Parallel transfer auf dem 
gemeinsamen Bus » 4 Byte, 
. - Zugriffsdauer zum Hauptspeicher RAM «100 Nanosekunden, 

- Zyklusdauer des Busses BUSA = 50 Nanosekunden, 

- Frequenz des Serientransf ers « 500 MHz, 

30 - Wahrscheinlichkeit des Nichtvorhandenseins Pa = 0,005 
( Cache -Speicher von 16 KByte) , 

- Leistungsfaktor der Prozessoren: alpha « 0,5. 

Beim Vergleich der Kurven A (erf indungsgemcUSe 
Architektur) und B (herkommliche Architektur) stellt man 
35 fest, dafi die erf indungsgemSSe Architektur einen deutlich 
hoheren WirJcungsgrad, als die herkommliche Architektur 
hat; die erf induiigsgemaSe Architektur ermdglicht den 
Einsatz einer sehr viel hoheren Anzahl von Prozessoren als 
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die herk&nmlichen Architekturen mit eiaem gemeinsamen Bus, 
die in der Praxis circa zehn Prozessoren nicht 
libers chrei ten k&nnen. So wird zum Beispiel in detn 
herkdmmlichen Pall ein Wirkungsgrad von 0,75 schon bei dem 
5 zehnten Prozessor erreicht, wohingegen er fur mehr als 80 
Prozessoren im Falle der Brfindung erreicht wird. 

Abbildung 3 stellt eine Durchftihrungsart einer 
Transferlogik TFRj oder TFR'j dar, die den Transfer eines 
Informationsblocks bi von einem Speicherregister RDMj zu 

10 einem Prozessorregister RDPj ermoglicht (fur den Transfer 
in die andere Richtung sorgen symmetrische Mittel, die in 
dieser Abbildung nicht dargestellt werden) . Jede Logik 
TFRj oder TFR f j enthSlt einen Sendekontrollteil TFREj und 
TFRE'j und einen Empf angskon troll teil TFRRj und TFRR'j, 

15 die gekreuzt aktiviert werden (Senden TFREj wird synchron 
mit dem Bmpfang TFRR'j aktiviert). Das System weist einen 
Taktgebergenerator H auf, dessen Frequenz die 
Obertragungsgeschwindigkeit festlegt und dem Sendeteil 
TFREj und dem Bmpfangsteil TFRR'j das Taktgeber signal h 

20 liefert. 

In dem Sendeteil TFREj ermoglicht ein 
Dekreraentalzahler DC, der durch seinen Ladeeingang load 2 
das Lesesignal r des Verwaltungsprozessors PGj erh&lt, das 
Durchlassen von t + 1 Taktgeberimpulsen h durch eine 

25 Verknupfung ET1 hindurch, die durch ein Null-Durchgangs- 
Signal auf "borrow" gesteuert wird, wobei der Ausgang 
dieser Verkntipfung ETl mit dem Dekrementiereingang "down" 
des Dekrementalz&hlers DC und mit dem Schiebeeingang 
shiftl des Speicherregisters RDMj verbunden ist. 

30 In dem Empf angsteil TFRR'j ist eine 

Kippschaltung B durch ihren Dateneingang D mit dem 
Serienausgaag des Prozessorregisters RDPj verbunden, und 
der Taktgebereingang elk dieser Kippschaltung ist mit dem 
Taktgeber H verbunden, urn das Signal h zu empfangen. Ein 

35 vom Verwal tungspr o z e s s o r PGj geliefertes 

Initialisierungssignal "init" ist mit dem Eingang S der 
Kippschaltung B 1 und dem Ladeeingang load3 des 
Prozessorregisters RDPj verbunden. Der Ausgang Q der 
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Kippschaltung sendet an die Verknupfung ET2 ein 
Steuersignal f in_transfer, das das Durchlassen des 
Taktgebersignals h zum Schiebeeingang shift 2 des 
Prozessorregisters RDPj ermoglicht. Dieses Steuersignal 
5 wird ebenfalls an den Verwaltungsprozessor PGj ausgegeben, 
urn das Ende des Blocktransf ers anzuzeigen. 

Das Gan2e funktioniert wie folgt: der 
Verwaltungsprozessor PGj, . filhrt, nachdem er den Zugriff 
auf den Hauptspeicher RAM fiber den Bus BUSA erhalten hat, 

10 seinen Lesevorgang des Blocks bi aus, indetn er die Adresse 
des betreffenden Blocks und das Lesesignal r liefert. 
Dieses Signal lost die Aktivierung des Sendeteils TFREj 
aus: die letzte Flanke des Lesesignals r bewirkt das Laden 
des Blocks bi im Speicherregister RDMj, durch die 

15 Aktivierung des Signals loadl und das Laden des t + 1- 
Wertes, der der GroSe des Blocks bi in Bits plus einem 
zusatzlichem Bit, "start"-Bit genannt, entspricht, in den 
Dekrementalzahler DC durch ' die Aktivierung des Signals 
load2; dadurch wird das Signal borrow auf 1 zuruckgesetzt 

20 und der fransfertaktgeber K erh&lt die Eriaubnis, uber die 
VerknUpfung ET1, die durch dieses borrow- Signal bedingt 
ist, t + 1 Taktgeberitnpulse h zu liefern: diese Iirpulse 
verschieben t + 1 Bits des Speicherregisters RDMj durch 
den shiftl-Eingang und lassen den Wert 0 durch den Eingang 

25 down des Dekrementalzahl ers DC erreichen: das Signal 
borrow wird auf Null zuruckgesetzt und blockiert den 
Betrieb der Sendeteils TFREj . 

So ubertragt die Serienverbindung LSj, zu 
Beginn ira Logikruhezustand 1, das Bit 0, das sogenannte 

30 Start -Bit, dann die t Bits des Blocks bi und geht dann 
wieder in den Logikruhezustand 1, wobei das zuletzt 
gesandte Bit der auf den Serieneingang des 
Speicherregisters RDMj gesetzte Wert 1 ist. 

Bevor der Lesevorgang angefordert wird, hat 

35 der Verwaltungsprozessor PGj den Empfangsteil TFRR 1 j durch 
Aktivierung des Signals init initialisiert, wodurch das 
Prozessorregister RDPj durch den Eingang load3 mit t Bits 
auf l geladen wird und der Ausgang Q der Kippschaltung B 
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durch den Eingang S in den Logikzustand 1 gesetzt wird. 
Dieser Ausgang Q gibt dann die VerknUpfung BT2 frei, die 
das Taktgebersignal h zum Eingang shift 2 des 
Prozessorregisters RDPj durchia&t. Bei jedem 
5 Taktgeberirapuls liefert dieses Prozessorregister ein Bit, 
das in der Kippschaltung B gespeichert wird an seinen 
Serienausgang. Durch das erste ankonnnende 0-Bit wird der 
Ausgang Q der Kippschaltung B auf Null gesetzt und das 
Taktgebersignal h auf der Verknupfung ET2 blockiert. Da 

10 dieses erste 0-Bit das Start-Bit ist, das dem Block bi 
vorangeht, ist dieser letztere also im Prozessorregister 
RDPj "gefangen", wShrend der Verwaltungsprozessor PGj von 
der ZustandsSnderung der Kippschaltung B durch das Signal 
fin_transfer informiert wird: der Verwaltungsprozessor PGj 

15 braucht diesen Block bi auf dem Parallelausgang des 
Registers RDPj nur noch zu lesen. 

Das Schreiben eines Blocks bi in den 
Hauptspeicher RAM benStigt das Vorhandensein einer Logik 
TFRE 1 j , die mit der Logik TFREj identisch xind dem 

.20 Prozessorregister RDPj zugeordnet ist, xind einer Logik 
TFRRj, die mit der Logik TFRR'j identisch und dem 
Speicherregister RDMj zugeordnet ist. In diesem Fall ist 
das Signal init der Logik TFRRj mit dem Schreibsignal w 
verbunden: das Freimachen des Speicherregisters RDMj setzt 

25 automat isch die Empf angslogik TFRRj zuruck. 

Diese Ausftlhrungsart der Logik zur 
Trans ferkontrolle ist nur ein mogliches Beispiel: das 
Senderegister kann selbst auch standig verschoben sein und 
das Empfangsregister bei Entdecken . des Start-Bits zu 

30 Beginn des Transfers fUr t Taktgeberimpulse aktiviert 
sein. 

Die Taktgeber H kann an beide Register 
angeschlossen sein, oder es konnen zwei unabhfingige lokale 
Taktgeber benutzt werden, wobei die Synchronisation auf 
35 herkdmmliche Art und Weise durch eine sogenannte 
Synchronisationspraambel erreicht wird. 

Das in'Abbildung 4 dargestellte System umfafit 
ein verdoppeltes Speicher-Schieberegister RDMlj und RDM2 j , 
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ein verdoppeltes. Prozessor-Schieberegister RDPlj und 
RDP2 j , zwei unidirektionale Seriendrahte LSlj und LS2j # 
wobei der eine das Speicherregister RDMlj mit dem 
Prozessorregister RDPlj so verbindet, dafi der Inhalt des 
5 ersten zum zweiten ubertragen wird und der andere das 
Speicherregister RDM2j mit dem Prozessorregister RDP2j so 
verbindet, dafi der Inhalt des zweiten zum ersten 
ubertragen wird, und es umfaSt zugeordnete Logiken zur 
Transferkontrolle: TFRElj fur RDMlj, TFRR2j fur RDM2j, 

10 TFRE2 : j fur RDP2 j , TFRR1 j fur RDPlj . 

Urn einen Informationsblock bi im Hauptspeicher 
RAM zu lesen, initialisiert der Verwaltungsprozessor PGj 
durch das Signal init die Logik TFRRlj , die dem 
Prozessorregister RDPlj zugeordnet ist, und aktiviert dann 

15 durch das Lesesignal r seine Lese-Anforderung an den RAM- 
Speicher. Dieses Signal aktiviert die dem Speicherregister 
RDMlj zugeordnete Logik TFRElj : diese sorgt fur den 
Transfer des Informationsblocks bi auf dem Draht LSlj. Das 
Ende des Transfers wird von der Logik TFRRlj entdeckt, die 

20 dem Prozessorregister RDPlj zugeordnet ist, der den 
Verwaltungsprozessor PGj von der Ankunft des Blocks bi 
durch das Signal fin_transfer informiert. Der 
Verwaltungsprozessor PGj ubertragt dann den Inhalt des 
Prozessorregisters RDPlj in den Cache -Speicher MCj. 

25 Um einen Speicherblock bi zu schreiben, l§dt 

der Verwaltungsprozessor PGj das Prozessorregister RDP2j 
mit dem betreffenden Block bi, der aus dem Cache- Speicher 
MCj ausgezogen wird, was den Transfer dieses Blocks auf 
dem Draht LS2j aktiviert. Die dem Speicherregister RDM2j 

30 zugeordnete Transferlogik TFRR2j sorgt fur den richtigen 
Empfang dieses Blocks. Der Verwaltungsprozessor PGj wird 
durch die Zustandsanderung des Signals borrow, das aus der 
Ubertragungslogik TFRE2j kommt, vom Ende des ' Transfers 
informiert. Der Verwaltungsprozessor PGj fxihrt dann seine 

35 Schreibanforderung aus, die bei Aktivierung des 
Schreibsignals w" effektiv wird: dadurch wird der Inhalt 
des Registers RDM2j in den Hauptspeicher RAM ubertragen 
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und die Logik TFRR2j fur einen nSchsten Transfer erneut 
initialisiert. 

Diese Vorrichtung erlaubt einen gleichzeitigen 
Transfer von B16cken in beide Richtungen und ermSglicht 
5 die schnellere Verarbeitung des Fehlens von Bldcken bi im 
Cache-Speicher MCj, wenn dieser letztere gesattigt ist; 
sie erlaubt auch den Einsatz eines herkfiramlichen 
Antizipationsmechanismus zum Lesen von B16cken. 

In einer anderen in Abbildung 5 dargestellten 

10 Durchffchrungsart umfafct die Verbindung LSj einen einzigen 
bidirektionalen Draht, der an jedem Bnde mit einer 
Freigabelogik LV a und LV 2 ausgestattet ist, die aus einer 
Verkmipfung mit zwei Eingangen mit offenem Kollektor OCx 
und 0C 2 besteht, wobei einer der EingSnge mit dem 

15 Serienausgang des Speicherregisters RDMj £to die 
VerknQpfung OCx und des Prozessorregisters RDPj fur die 
Verkniipfung OC 2 verbunden ist und der andere Eingang mit 
dem Ausgang Q einer Steuer-Kippschaltung BC X und BC 2 
verbunden ist; jede dieser Kippschaltungen ist durch ihre 

20 Eing&nge S und R mit der Transferlogik TFR fur die 
Kippschaltung BC^ und TFR 1 fur die Kippschaltung BC 2 
verbunden. 

Lesen und Schreiben erfolgt ausschliefiend und 
wird nur vom Verwaltungsprozessor PGj aktiviert. 

25 Das Lesen des Speichers aktiviert das 

Lesesignal r, das durch ihren Eingang S das Setzen der 
Kippschaltung BC X auf 1 bewirkt; das Zurucksetzen auf Null 
wird durch die Transferlogik TFR am Ende des 
Blocktransfers auf dem Eingang R gesteuert, 

30 Das Schreiben in einen Speicher lost denselben 

Mechanismus auf die Freigabelogik LV 2 aus. 

Andere Kombinationen Register/DrShte sind 
moglich, und im Falle eines bidirektionalen Drahts konnen 
insbesondere bidirektionale Schieberegister benutzt 

35 werden, die ein Signal fur die Transferrichtung erhalten. 
Diese Losung fuhrt zu der Nutzung von bezuglich der Logik 
komplexeren Schieberegistern, also eigentlich weniger 
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leistungsfahigen, was die Transf ergesdbwindigkeit 
betrifft. 

Da die Transf ergeschwindigkeit sehr hoch sein 
raufi, werden die Schieberegister RDMj und RDPj, ihre 
5 zugeordneten Steuerlogiken TFR und TFR ! und 
Freigabelogiken LV X und LV 2 aus einer schnellen 
Technologie ausgew^hlt (ECL, ASGA) und durch einen 
Taktgeber mit einer Frequenz F von wenigstens 100 MHz 
synchronisiert . 

10 Eine andere, in Abbildung 21 dargestellte 

Losung mit multiplexierten Registern erraoglicht, wie man 
spfiter verstehen wird, eine erhebliche Verringerung der 
notwendigen leistungsfahigen, also teuren, Logik. 

Das Mehzprozessorsystem der Abbildung 1 war 

15 gleichzeitig mit einem gemeinsamen Bus fur die Ubertragung 
von Blockadressen und mit Serienverbindungen fir den 
Datentransfer ausgestattet . Abbildung 6 stellt als 
Variante ein Mehrprozessorsystem mit demselben allgemeinen 
Prinzip dar, bei dem jedoch Daten und Adressen uber die 

20 Serienverbindungen ohne gemeinsamen Bus ubertragen werden. 

Dieses System umfaSt aufier den 
Speicherregistem RDMj zusStzliche Schieberegister RDCj, 
die geeignet sind, die angeforderten Adressenblocke zu 
speichern und die durch eine Logik des Typs TFRj gesteuert 

25 werden. Aufierdem ist . ein Arbiter fur die 
Zugriffsverwaltung ABM mit dem Hauptspeicher RAM und mit 
den Zusatzregistern RDCj durch ihren parallelen Ausgang 
verbunden. Jede Logik TFRj ist mit diesem herkommlich 
strukturierten Arbiter ABM verbunden. Der 

30 Verwaltungspozessor PGj von jedem Cache- Speicher MCj ist 
deshalb rait einem Teil des parallelen Eingangs des 
Prozessorregisters RDPj verbunden, urn auf diesen fur das 
Schreibeh Zugriff nehmen zu konnen. 

Um einen Block bi im Hauptspeicher RAM zu 

35 lesen, stellt der Verwaltungsprozessor PGj die Adresse des 
angeforderten Blocks und die Art der Anforderung (durch 
ein Prafix-Bit: l" « Lesen, 0 = Schreiben) in den ihm 
zuganglichen Teil des Prozessorregisters RDPj, wodurch der 
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Transfer dieser Information initialisiert wird. Die 
Transferlogik TFRj entdeckt das Transferende auf dem 
Zusatzregister RDCj und aktiviert eine Operations - 
Anf orderung zum Arbiter ABM; dieser hat die Aufgabe der 
5 Parallel-Seriell-Umsetzung der Lese -Anforderung des Blocks 
und deren Verarbeitung im Hauptspeicher RAM, indem er die 
Adresse des im Zusatzregister RDCj angeforderten Blocks 
liest, das der vom Arbiter ABM gew^hlten Transferlogik 
entspricht und indem er dann den Block im Hauptspeicher 

10 RAM liest, der danach in das Speicherregister RDMj geladen 
und wie zuvor ubertragen wird. 

Urn einen Block in den Hauptspeicher RAM zu 
schreibeh, fuhrt der Verwaltungsprozessor PGj nacheinander 
durch das Prozessorregister RDPj die Obertragung der 

15 Adresse und dann des zu schreibenden Blocks aus. Das 
Zusatzregister RDCj empfingt somit zuerst die Adresse und 
die Art der Anf orderung. 

Die Transferlogik TFRj analysiert diese 
Anf orderung und gibt den Empfang des Blocks im 

20 Speicherregister RDMj aufgrund der Art der Anforderung 
(Schreiben) frei. Die Transferlogik TFRj wird vom Ende des 
Transfers des Blocks bi informiert und ubertragt dann an 
den Arbiter ABM seine Dienstabf rage . Diese Anforderung 
wird vom besagten Arbiter, der das Schreiben des Blocks bi 

25 in den Speicher aktiviert, verarbeitet, sobald er an der 
Reihe ist. 

Im ubrigen umfafit das in Abbildung 7 
dargestellte Mehrprozessorsystem Mittel fur die Verwaltung 
der geteilten Daten, die es ermoglichen, statisch das 
30 herkoramliche Problem der Auf rechterhaltung der Koharenz 
der geteilten Daten zu losen. Dieses System umfaSt die 
Systemhilfsmittel der Abbild\ing l (dieselben 
Bezeichnungen) mit den folgenden Logiken und Zusatz- 
Hilfsmitteln: 

35 Ein spezieller Bus fur die parallele 

Wortubertragung BUSD verbindet die Prozessoren CPUj und 
den Hauptspeicher RAM . Eine Partitionslogik LPj ist jedem 
Prozessor CPUj zugeordnet; jede Logik LPj besteht 
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herkommlicherweise. aus mehreren Register-Komparator- 
Paaren, die parallel an den AdreSbus adr des Prozessors 
CPUj angeschlossen sind, urn eine Aufteilung des 
Speicherbereichs des Hauptspeichers RAM in Zonen fur nicht 
5 geteilte Da ten und geteilte Daten durchzufuhren; dazu gibt 
die besagte LogiJc LPj ein Signal p aus (das die Art der 
Daten, geteilt Oder nicht, angibt) . Eine Decodierungslogik 
DEC ist dem Hauptspeicher RAM zugeordnet, der selbst so 
angeordnet ist, dafi er von der besagten Logik DEC fur das 

10 Schreiben in Wortern oder Blocken gesteuert werden kann. 

Die Decodierungslogik DEC ist in Abbildung 8 
detailliert dargestellt und umfafit einen Decodierer DECL, 
der auf seinem Dateneingang den Wortadre&teil adrm der 
Adresse adr empfangt und der durch seinen Freigabeeingang 

IS mit dem Ausgang einer Verkniipfung ET3 verbunden ist, wobei 
jeder Ausgang i des besagten Decodierers mit einem 
Ausgangsfreigabe- "Puffer" BFSi verbunden ist. Die 
Verkniipfung BT3 empfangt auf ihren Eingangen das Signal p 
und das invertierte Signal r. Ein Decodierer DECE ist auch 

20 durch seinen Dateneingang mit dem Bus adrm und durch 
seinen Freigabeeingang an den Ausgang einer Verkniipfung 
ET4 verbunden, seine Ausgange sind mit mehreren 
Verknupfungen OUli deren Anzahl genauso groS ist, wie die 
der Worter in einem. Block, verbunden. Die Verkniipfung ET4 

25 empfangt auf ihren Eingangen das Signal p und das 
invertierte Signal w. Der Ausgang der Verkniipfung ET4 ist 
ebenfalls mit mehreren • Eingangsfreigabe-"Puf fern" BFE 1 , 
BFEi ... verbunden. Der Hauptspeicher RAM kann fur das 
Wort-Schreiben. gesteuert werden. Jede so definierte Wort- 

30 "scheibe" hat ihren Schreibsteuereingang w A . Der Ausgang 
jeder Verknupfung 00*1* ist mit dem Eingang w t jeder Wort- 
"schsibe" des Hauptspeichers RAM verbunden. 

Abbildung 8 stellt aufierdem im Detail die 
Adressierung der Speicherregister RDMj dar, die an erster 

35 S telle einen Decodierer DECEB umfaSt, der durch seinen 
Dateneingang mit dem gemeinsamen Bus BUSA verbunden ist, 
urn die Nummer j des von der Abfrage der Zentraleinheit UCj 
betroffenen Prozessors zu empfangen; dieser Decodierer 
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DECEB ist - durch seinen Freigabeeingang mit dem Ausgang 
einer Verknupfung ET5 und durch seine Ausginge 1, 2 . j 
mit Freigabe- n Puff ern" BV 1# BVj ... verbunden. Die 
Verknupfung ET5 empf&ngt auf ihren Eingangen die 
5 invertierten Signale p und w. GleichermaBen ist auch ein 
Decodierer DECLB durch seinen Dateneingang mit dem Peld j 
des gemeinsamen Busses BUSA und durch seinen 
Freigabeeingang mit dem Ausgang einer Verkntipf ung ET6 
verbunden; die Ausgange 1, 2 ... j dieses Decodierers 
10 DECLB sind mit. den Ladeeingangen ld x und ldj der Speicher- 
Schieberegister RDMj verbunden. Die Verknupfung ET6 
empfangt auf ihren Eingangen die invertierten Signale p 
und r. 

Das System funktioniert wie folgt: bei jeder 

15 Speicherreferenz liefert der Prozessor CPUj eine Adresse 
auf seinen AdrelSbus adr und die Abfrageart: Lesen r Oder 
Schreiben w. Fur das Lesen erwartet er Daten und ftix das 
Schreiben liefert er Daten. Die Adresse adr geht durch die 
Partitionslogik LPj, die durch das Signal p angibt, ob die 

20 Adresse adr zu einem Bereich von nicht geteilten Daten {p 
■* 0) oder von geteilten Daten (p = 1) gehort. Im ersten 
Fall wird die Anforderung zum Verwaltungsprozessor PGj 
geleitet und gern^fi dem in Abbildung 1 beschriebenen 
Betriebsmodus verarbeitet. Ira zweiten Fall wird die 

25 Abfrage direkt zum gemeinsamen Bus BUSA geleitet; der Bus 
der Adresse adr enthalt zuscltzliche Adressendr&hte f<ar die 
Identifizierung des betreffenden Worts; die Adresse adr 
besteht zu einem Teil aus der Blockadresse adrb und zum 
anderen Teil aus der Wortadresse adrm. So empfangt der 

30 Hauptspeicher RAM, nach Erlaubnis des Busarbiters AB, 
entweder eine Anforderung fdr eine Blocktransaktion (p = 
0) , und in diesem Fall ist nur der Blockteil adrb der 
Adresse adr von Bedeutung, oder eine Anforderung fur eine 
Worttransaktion (p - 1) , und in diesem Fall ist die ganze 

35 Adresse adr (Block adrb und Wort adrru) von Bedeutung. 

Fur das Lesen eines Blocks, p = 0 und r = 0, 
gibt die Verknupfung ET6 den Decodierer DECLB frei, der 
ein Ladesignai LDj an das Schieberegister RDMj ausgibt, 
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was das Laden des Blocks in diesen letztereii ermoglicht, 
nachdem der Block an der Adresse adrb durch das Lesesignal 
T iro Hauptspeicher RAM gelesen wurde. 

Fir das Schreiben eines Blocks, p * 0 und w = 
5 0, gibt die Verknupfung ET5 den Decodierer DECEB frei, der 
ein Freigabesignal auf dem "Puffer" BVj ausgibt; dadurch 
kann der Inhalt dieses Registers dem Hauptspeicher RAM 
vorgelegt und sorait an der Adresse adrb geschrieben 
werden, wobei das Schreibsignal des Blocks vom Ausgang der 
10 Verknupfung ET5 geliefert wird. Dieses Signal wird durch 
die Verknupfungen OUl^ auf den Schreibeingangen w A , w$, 
j an die Wort-"scheiben" des Hauptspeichers RAM 

ausgesandt . 

Fur das Lesen eines Worts, p = 1 und r = 0, 
15 gibt die VerknQpfung ET3 den Decodierer DECL frei, der ein 
Freigabesignal auf dem "Puffer" BFS^ ausgibt, wodurch das 
angef orderte Wort (der Adresse adrm im Block adrb) , das 
durch das Signal r gelesen wird, zu dem speziellen 
Obertragungsbus BUSD geleitet werden kann. Dieses Wort 
20 wird direkt von dem Prozessor CPUj auf seinen Dateneingang 
data aufgenommen. 

Fur das Schreiben eines Worts, p « 1 und w = 
0, gibt die Verknupfung ET4 den Decodierer DECE frei, der 
auf seinem Ausgang i ein Signal liefert, das durch "die 
' 25 Verknupfung OUli zum Schreibeingang der Wort n scheibe n 
des betreffenden Hauptspeichers RAM geleitet wird; dieses, 
am Eingang w^ vorhandene Signal ermoglicht das Schreiben 
des von dem Prozessor CPUj auf den Datenbus BUSD 
gelieferten Worts nur in diese Wort-"scheibe" . Der Inhalt 
30 dieses Busses wird parallel auf alien Wort u scheiben" des 
Hauptspeichers RAM vorgelegt, und zwar dank der 
Aktivierung der "Puffer" BFE^ durch das aus der 
Verknupfung ET4 kommende Signal. 

Eine wesentliche Eigenschaft der 1 

35 erfindungsgen&fien Architektur ist die minimale Abfragelast 
auf dem gemeinsamen Bus BUSA. In der in Abbildung 7 
schematisierten Architektur wird der gemeinsame Bus BUSA 
von Blockadressen und Wortadressen beansprucht. Die 
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Frequenz der Anf orderungen nach Wortadressen ist abh^ngig 
von der Rate der geteilten Daten und kann zu einer 
Sattigung des gemeinsamen Busses BUSA ftihren. 

Abbildung 9 stellt in einer Variante eine 
5 Losung zur Verringerung dieser Last dar. Das angestrebte 
System umfafit aufier den Hilf smitteln der Abbildung 7, 
einen Bus BUSAM fur die Wortadressen, einen Arbiter AB 1 
zur L6sung der Zugrif f skonf likte auf den Bus BUSAM, einen 
Arbiter ABM zur L6sung der Zugrif f skonf likte, die von den 

10 Bussen BUSA und BUSAM koramen, und ist mit einem 
Multiplexer MUX verbunden, der selbst durch seine Eing&nge 
mit den beiden Bussen BUSA und BUSAM verbunden ist. 

Dieses System funktioniert wie folgt: wie 
zuvor liefert die Partitionslogik LPj das Signal p zur 

15 Identifizierung der Art der raanipulierten Daten. 

Betrifft die Anforderung nicht geteilte Daten 
(p - 0) , dann bewirkt jedes Fehlen von Informationen eine 
Speicherabfrage von dem Blocktyp, die durch den 
gemeinsamen Bus BUSA fibertragen wird, 

20 Betrifft die Anforderung geteilte Daten (p - 

1), wird die Abfrage zum gemeinsamen Bus BUSAM geleitet. 
So kann der Hauptspeicher RAM auf den beiden Bussen BUSA 
und BUSAM gleichzeitige Anf orderungen erapfangen, die 
geschlichtet sein . trrQssen. Der Arbiter ABM erteilt einer 
» 25 der beiden Abfragen auf herkommliche Art und Weise den 
Zugrif f auf den Hauptspeicher RAM und rekonstituiert das 
Signal p anhand der Herkunft der Anforderung (p = 0 f\ir 
BUSA, p = 1 fur BUSAM) . Das Signal p steuert dann 
einerseits den Multiplexer MUX, der die Signale des von 

30 der Abfrage betroffenen Busses durchlSLfit, und andererseits 
die Decodierungslogik DEC: man befindet sich in derselben 
Situation, wie der des vorhergegangenen Systems. 

Es ist f estzustellen, da£ sich die Last vom 
gemeinsamen* Bus zum Hauptspeicher RAM verlagert hat, da 

35 die Rate der Abfragen bei diesem letzteren dieselbe bleibt 
und seine Zyklusdauer von der gleichen Grdfienordnung ist 
oder sogar noch uber'der des Buszyklus liegt. 
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Diese Losung ist also nur interessant , wenn 
der Hauptspeicher RAM aus unabhangigen Hauptspeicherbanken 
besteht, die gema£ der sp&ter gegebenen diesbezuglichen 
Beschreibung der Abbildung 20 angeordnet sind: mehrere 
5 Transaktionen konnen in diesem Fall gleichzeitig 
stattfinden, wenn sie verschiedene SpeicherbSnke 
betreffen. 

Abbildung 10 stellt ein synoptisches Schema 
einer erf indungsgemSfien Axchitektur-Durchfuhrungsart dar, 

10 bei der das Problem der geteilten Daten dynamisch geldst 
wird. Dazu besitzt die dieser Durchffthrungsart 
entsprechende Vorrichtung einen Busspion-Prozessor PEj, 
der an einen Verwaltungsprozessor des parallelen Drahts 
PGPj gekoppelt ist. Ein Verwaltungsprozessor des 

15 Seriendrahts PGSj ist mit dem Spion-Prozessor PEj durch 
eine Warteschlange FIFOj verbunden. Ein Prozessor fur die 
Verwaltung von Abfragen der Zentraleinheit PGUj ist 
einerseits mit dem Verarbeitungs -Prozessor CPUj und 
andererseits mit den Prozessoren fur die Verwaltung des 

20 parallelen Drahts PGPj und die Verwaltung des Seriendrahts 
PGSj verbunden. Die dem Verwaltungsprozessor PGj von jedem 
Cache- Speicher entsprechende Logik ist in dieser 
Durchfuhrungsart in die verschiedenen oben dargestellten 
Prozessoren aufgeteilt. Der Zugriff auf den Cache -Speicher 

25 MCj und dessen Verzeichnis RGj wird durch einen Prozessor 
fur die Verwaltung des Verzeichnisses und des Caches - 
Speichers PGRj geregelt. 

Schliefilich ist ein Prozessor fur die 
Verwaltung des Haupt speichers RAM PGM an den Bus BUSA und 

30 an den Hauptspeicher RAM und an dessen Schieberegister 
RDMj anges chlos sen. 

Das Ganze funktioniert f olgendermaSen : 
Jede Transaktion auf dem gemeinsamen Bus BUSA 
entspricht einer Lese- Oder Schreib-Anforderung eines 

35 Blocks bi. Die Busspion-Prozessoren PEj werden durch jede 
Lese-Anf orderung eines Datenblocks aktiviert. Diese 
Operation, die ihnerhalb desselben Zyklus von alien 
Spionprozessoren durchgefuhrt wird, ermoglicht es, die 
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Einzigartigkeit der Werte der geteilten Daten zu 
garantieren. Der Spionprozessor PEj verfugt uber einen 
Zugang zum Verzeichnis RGj . Die Anwendungsfunktion, die 
fur die Verwaltung des Cache-Speichers MCj verwendet wird, 
5 ist in der beschriebenen Durchfuhrungsart vom Typ einer 
direkten Anwendung. Jedes Element des Verzeichnisses ist 
ein Blockstichwort, das ein Peld "tag" (Blockadresse) und 
herkommliche Zustandsbits des Blocks enth&lt: ein 
Freigabebit v und ein Modifikationsbit m und zwei 

10 Zusatzbits a, um anzuzeigen, daS der Block dem Cache- 
Speicher bekannt 1st, jedoch noch im Zuge des Transfers 
auf der Serienverbindung, und f, urn anzuzeigen, da£ sich 
der Block in der Warteschlange FIFO befindet, urn so zu 
verhindern, dafi er mehrmals dort plaziert wird. 

15 Der Speicher-Verwaltungsprozessor PGM verfugt 

einerseits uber eine assoziativ zugSngliche Warteschlange 
AFIFO fiir Adressen von Bldcken bi und ftir 
Prozessoradressen, andererseits uber ein Verzei chn is der 
BlockzustSnde, die aus 2 Bits pro Block ro mid rw bestehen 

20 und die die folgenden mSglichen BlockzustSnde angeben: 
. ro = rw = 0: Block noch nicht ausgesandt, 
. ro « 1? rw = 0: Block bereits fir das Lesen 
ausgesandt: eine Oder mehrere Kopien dieses Blocks 
befinden sich in den Cache- Speichern, 

25 . ro = 0; rw « 1: Block filr das Schreiben 

ausgesandt: die aktualisierte Kopie dieses Blocks befindet 
sich in einem Cache-Speicher. 

Die Entwicklung der Blockzustandsbits ist die 
folgende und je nach Art der Anforderung des 

30 Verarbeitungs-Prozessors CPUj unterschiedlich: 

- fordert der Prozessor CPUj das Lesen nicht 
geteilter Daten en (Bereich fur Programm oder filr die 
explizit nicht geteilten Daten) : der Block wird im 
Hauptspeicher als bereits fur das Lesen ausgesandt beitn 

35 Transfer des besagten Blocks vora Hauptspeicher RAM zum 
Register RDMj (ro = 1; rw = 0) und als nicht modifiziert 
{m a 0) im Cache-Speicher innerhalb desselben Update- 
Zyklus des verzeichnisses RGj des Cache-Speichers 
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(giiltiger Block) gekennzeichnet. Die Spione haben nicht 
auf die Abfrage auf dem gemeinsamen Bus reagiert (da die 
Anforderung mit dem Hinweis "nicht geteilte Daten " gemacht 
wurde) , 

5 - fordert der Prozessor CPUj das Lesen der 

Daten (apriori geteilt) an, dann ist der Bus BUSA wShrend 
der Dauer der Obergabe der Adresseninformationen und der 
Art der Abfrage, der Dauer ihrer Verarbeitung durch den 
Prozessor PGM und die spione des gemeinsamen Busses PEj 
10 belegt. Im Hauptspeicher RAM kann dieser Block: 

1. Noch nicht ausgesandt sein: ro » rw » 0. Er 
vird dann an die Zentraleinheit UCj Qbertragen und nimmt 
den nicht modif izierten Zustand an, 

2. Bereits fUr das Lesen ausgesandt sein: ro « 
15 if rw ■ 0. Er wird dann an die Zentraleinheit UCj 

tibertragen. Sein Zustand Sndert sich nicht, 

3. Bereits ftir das Schreiben ausgesandt sein: 
ro = 0; rw ■ 1. Die aktualisierte Kopie dieses Blocks 
befindet sich in einem Cache-Speicher MC^. Der diesem 

20 Cache-Speicher zugeordnete Spionprozessor PE^ hat die 
Anforderung der Zentraleinheit UCj wShrend der Obergabe 
der Adresse auf den gemeinsamen Bus registriert und den 
Transfer des Blocks in den Hauptspeicher HAM sobald vie 
moglich auf seiner Serienverbindung LS^ vorgenommen. Bis 

25 zum ef fektiven Transfer stellt der Speicher- 
Verwaltungsprozessor PGM die Anforderung in die 
assoziative Warteschlange, die eine Anzahl von Stellen 
enthalt die gleich der Anzahl der Prozessoren ist. 

Bei der Lese-Anf orderung auf dem gemeinsamen 

30 Bus BUSA haben alle Spionprozessoren PE^ durch 
Konsultation des ihrem Cache-Speicher MC^ zugeordneten 
Verzeichnisses RG^ reagiert. Der gemeinsame Bus BUSA wird 
nur freigegeben, wenn alle Spionprozessoren PE^ ihren 
Zugriff auf das Verwaltungsverzeichnis RG^ genommen haben, 

35 was denselben Blockzustand im ganzen System garantiert. 
Der Prozessor, der die aktualisierte Kopie in seinem 
Cache-Speicher hat, fiihrt, sobald seine Serienverbindung 
frei ist, den Transfer dieses Blocks in das Register RDM^ 
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aus und ftihrt eine Schreib-Anf orderung des Blocks auf dem 
gemeinsamen Bus durch, wodurch die in der assoziativen 
Warteschlange AFIFO wartende Anforderung freigemacht wird 
und das Update der Blockzustandsbits erfolgt. 
5 Fir das Update des Blocks wird also lediglich 

das Schreiben in den Hauptspeicher RAM ohne Aktivierung 
der Spione bendtigt. 

- Fordert der Prozessor CPUj das Schreiben von 
Daten in einen in seinem Cache-Speicher MCj vorhandenen 

10 Block mit dem nicht veranderten Zustand an, dann mufi auf 
dem gemeinsamen Bus BUSA eine Informations -Schreib- 
Anforderung gesandt werden, da es m&glich ist, daE andere 
Cache- Speicher MC i diesen Block in demselben Zustand 
besitzen. Diese anderen Speicher nrussen von der 

15 ZustandsSnderung informiert werden. Zu diesem Zweck 
konsultieren alle Spionprozessoren PEi (durch den auf dem 
gemeinsamen Bus BUSA ausgesandten Informations- 
Schreibvorgang aktiviert) ihr Verwaltungsverzeichnis RG± 
und ma chen diesen Block ungultig, wahrend der 

20 Hauptspeicher und der parallele verwaltungsprozessor PGPj 
zu derselben Zeit die Zustandsanderung dieses Blocks im 
Verwaltungsverzeichnis RGj registrieren. Das Freimachen 
des gemeinsamen Busses BUSA durch alle Spionprozessoren 
und den Hauptspeicher RAM ermdglicht dem Prozessor CPUj 

25 die Durchfuhrung des Schreibvorgangs in seinen Cache- 
Speicher MCj , da das Update des Zustandbits des 
Verwaltungsverzeichnisses RGj erfolgt ist. 

Wartet eine Zentraleinheit auf einen Zugriff 
auf den Bus BUSA beztiglich derselben Abf rage auf demselben 

30 Block, so wandelt sich ihre Anforderung in einf aches 
Schreiben und folgt dann dem Anf orderungsprotokoll fir das 
Schreiben eines Blocks. 

- Fordert der Prozessor CPUj das Schreiben von 
Daten in einen im Cache-Speicher MCj nicht vorhandenen 

35 Block an, dann wird dieser Block im Hauptspeicher RAM 
gelesen und in den Cache-Speicher MCj geleitet, damit das 
Schreiben effektiv' wird. 

Im Hauptspeicher RAM kann dieser Block: 
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1. Noch nicht ausgesandt sein: ro » rw « 0. 
Der Block wird dann auf der Serienverbindung LSj in den 
Cache-Speicher MCj gesandt. Er nimmt im Hauptspeicher die 
Zustande ro = 0; rw = 1 und im Cache-Speicher den 

5 n modifiziert°-Zustand (tti = 1) an, 

2. Bereits zum Lesen ausgesandt sein: ro = 1; 
rw « 0. Der Block wird auf der Serienverbindung LSj in den 
Cache-Speicher MCj gesandt. Er nirarat im Hauptspeicher die 
ZustSnde ro = 0; rw = 1 und im Cache-Speicher den 

10 B modifiziert n -Zustand (m = 1) an. Bei der Anforderung auf 
dem gemeinsamen Bus BUSA, haben die Spionprozessoren PEi 
die Abfrage registriert und diese Blocknummer in ihrem 
Cache-Speicher MC* ungultig gemacht, 

3. Bereits zum Schreiben ausgesandt sein: ro = 
15 0; rw = 1. Die Anforderung wird in die assoziative 

Warteschlange AFIFO gestellt und der gemeinsarae Bus BUSA 
f reigemacht . 

Der Spionprozessor PE^ des Cache -Speichers 
MCi, Besitzer der aktualisierten Kopie, aktiviert sobald 
20 wie moglich den Transfer des angeforderten Blocks aus 
seinem Cache-Speicher MCi in den Hauptspeicher RAM. Dieser 
Block wird dann im Cache-Speicher MCi ungultig gemacht. 

Die Zentraleinheit UCj fuhrt eine Schreib- 
Anforderung fur ein Block-Update in den beiden folgenden 
25 Fallen durch: 

a) der Cache-Speicher ist gesdttigt und die 
vollstandige Entladung eines Blocks benotigt das Update 
dieses Blocks im Hauptspeicher, 

b) eine Zentraleinheit UCi erwartet einen 
30 Block, dessen einzige aktualisierte Kopie sich im Cache- 
Speicher MCj befindet. Der Spionprozessor PEj registriert 
die Anforderung und fuhrt sobald wie moglich die 
vollstandige Entladung dieses Blocks durch. 

Seitens des Hauptspeichers RAM bewirkt jede 
35 Update-Schreib-Anforderung eine Konsultation der 
assoziativen Warteschlange AFIFO und, bei Entdecken einer 
auf diesen Block wartenden Zentraleinheit UC i# das Laden 
dieses Blocks in das Schieberegister RDM^ und das Update 
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der diesem Block entsprechenden Zustaridsbits, Diese Art 
der Schreib-Anf orderung beansprucht also nicht die 
Spionprozessoren. 

Der Verzeichnis-Verwaltungsprozessor PGRj, der 
5 bei dieser Durchfuhrungsart hinzugefiigt wird, ermoglicht 
den Ablauf des oben angesprochenen Algorithmus, indem er 
die Zugriffe auf das Verzeichnis des Cache -Speicliers MCj 
koordiniert und die Abfrage von drei funktionellen 
asynchronen Einheiten empfangt: 
10 1- Vom Verarbeitungs-Prozessor CPUj, um die 

Instruktionen des gerade ausgefuhrten Programms zu lesen 
und die von diesem Prograram manipulierten Daten zu lesen 
Oder zu schreiben, 

2 . Vom gemeinsamen Bus BUSA, um die Koharenz 
15 der Daten im Cache- Speicher MCj aufrechtzuerhalten, 

3 . Von der Serienverbindung LS j , um einen 
Informationsblock aus/in den Hauptspeicher RAM zu laden/zu 
entladen. 

Jede dieser Abfrages nimmt Zugriff auf das 

20 Verwaltungsverzeichnis RGj des Cache -Speichers. Die 
Parallel-Seriell-Umsetzung dieser Zugriffe auf das 
genannte Verwaltungsverzeichnis ermoglicht den richtigen 
Ablauf des oben angesprochenen Algorithmus der 
Inf ormationskoharenz in den Cache- Speichern. So erh&lt man 

25 eine starke Kopplung der Abfrage beim 
Verwaltungsverzeichnis RGj, jedoch ist die 
Synchronisation, die bei der Verarbeitung dieser Abfrage 
bestehen tnuE, schwach genug, um einen asynchronen Betrieb 
der Verarbeitungslogik dieser Abfrages ins Auge zu fassen, 

30 was zu der folgenden funktionellen Aufteilung fuhrt: 

Die Schnittstelle eines jeden Prozessors CPUj 
und seiner Hilf sprozessoren (PGSj , PGUj) rait dem 
gemeinsamen Bus BUSA besteht aus zwei Teilen, die hur 
funktionieren, wenn sie sich gegenseitig ausschliefcen: der 

35 Verwaltungsprozessor des parallelen Drahts PGPj hat die 
Aufgabe, den gemeinsamen Bus BUSA auf Anf orderung des 
Abf rage-Verwaltungsprozessors PGUj oder des 

Verwaltungsprozessors des Seriendrahts PGSj zu fordern und 
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den geme ins amen Bus BUSA fur den Schreibvorgang. zu 
steuern. Der Busspion-Prozessor PEj ftihrt die 
Spionageaufgabe aus, was darauf hinauslauft, den 
gemeinsaraen Bus BUSA fur den Lesevorgang zu steuern. Er 
5 nimmt oft Zugriff auf das Verzeichnis RGj des Cache- 
Speichers MCj. 

Der Verwaltungsprozessor des Seriendrahts PGSj 
verwaltet die Schnittstelle rait der Serienverbindung LSj. 
Br fuhrt das Laden und Entladen von Informationsblocken bi 
10 auf Anforderung des Abfrage-Verwaltungsprozessors PGUj und 
des Busspion-Prozessors PEj aus. Er nirarat selten Zugriff 
1 auf den Cache -Speicher MCj und auf das entsprechenden 
Verwaltungs verzeichnis RGj . 

Der Abf rage-Verwaltungsprozessor PGUj sorgt 
15 fur den Fort 1 auf der Abf rage aus dem Prozessor CPUj . Er 
nimrat sehr oft Zugriff auf den Cache-Speicher MCj und auf 
das Verwaltungs verzeichnis RGj . Diese Schnittstelle 
beinhaltet die eventuelle Logik fur die "MMU n {"Memory 
Management Unit"), die gewohnlich dem Verarbeitungs- 
20 Prozessor CPU* zugeordnet ist. 

Der Verwaltungsprozessor PGRj des 

Verwaltungsverzeichnisses RGj ist der rait der Zuteilung 
des Zugriffs auf den Cache-Speicher MCj beauftragte 
Arbiter. 

J 25 Die Abbildungen 11, 12, 13, 14, 15, 16 und 17 

stellen als Beispiele Durchfuhrungsarten der verschiedenen 
funktionellen Einheiten der Vorrichtung von Abbildung 10 
dar. Die Bezeichnungen der Signale Oder Ein- xind Ausgange 
der Einheiten sind wie gewohnt gewahlt worden. Signale mit 
30 derselben FunktionalitSt, die in jeder funktionellen 
Einheit von einem Basissignal aus erzeugt werden, werden 
mit derselben Referenz bezeichnet, zura Beispiel: dnp = 
nicht geteilte Daten, dl = Lese -Anforderung, maj = Update, 
de = Schreib-Anf orderung, ei = Informations - 
35 Schreibvorgang. Die Vorrichtung besitzt mehrere 
Prozessoren und der untere Index j hat bisher einen 
gangigen Prozessor 'und dessen Peripheriegerate bezeichnet ( - 
um die Beschreibung gefalliger zu machen, wurde dieser 
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untere Index auf diesen Abbildungen veggelassen und es ist 
selbstverstandlich, dafi die folgende Beschreibung alle 
funktionellen Einheiten betrifft, die mit jedem 
Verarbeitungs-Prozessor verbunden sind. Im Ubrigen 
5 definieren die mit x_YZ bezeichneten Signale den Namen und 
die Herkunft des Signals fttr den Fall wo YZ ■ RG, MC, UC 
ist, und in den anderen Fallen den Sender und den 
Empf Snger des Signals, wobei Y und 2: U - PGU, R = PGR, P 
= PGP Oder PE, S = PGS sind. 

10 Der in Abbildung 11 dargestellte Cache- 

Speicher MC hat zum Beispiel eine Kapazitat von 16 KByte. 
Er ist in 16 schnelle Schreib-Lese-Speicher-Module von je 
1 KByte angeordnet, MC 0 , ... MC 15 , wobei jedes auf einer 
Breite von 4 Byte zugSnglich ist: der AdreBbus des Cache- 

15 Speichers MC (mit adr_MC bezeichnet) umfaBt einen 
BlockadreBteil adr_bloc und einen WortadreBteil in dem 
Block adrjnot. Der AdreBbus adr_MC besteht aus 14 DrShten, 
die es eriuoglichen, die 16 KByte des Cache-Speichers MC zu 
adressieren. Der Teil adr_bloc umfaBt 8 DrShte, die eine 

20 Adressierung der 256 Blockstellen des Cache-Speichers MC 
ermSglichen, und der Teil adrjnot 6 Drahte, die es 
ermSglichen, ein Wort in den in dem Beispiel 64-Byte-Block 
zu adressieren. 

Der AdreBteil adr_bloc ist mit dem 

25 AdreBeingang jedes Speichermoduls MC Q ... MC 15 verbunden. 
Der WortadreBteil adrjnot ist mit dem Eingang von zwei 
Decodierern DEC0 und DEC1 verbunden (nur die 4 
hochstwertigen Bits des AdreBbusses adr_mot werden 
genutzt: die Adresse ist eine Byte-Adresse und der Cache- 

30 Speicher hat als Zugrif fseinheit ein Wort von 4 Byte) . Das 
Lesesignal "r_MC wird an jeden Leseeingang der 
Speichermodule MC 0 . . . MC 15 und an einen der EingSnge 
einer Verknttpfung OU1 ausgegeben. Der andere Eingang 
dieser Verknupfung 0U1 empfangt das invertierte Signal 

35 bloc. Das Schreibsignal w_MC wird an einen der beiden 
Eingang e von Verkntipfungen OU2 und 0U3 ausgegeben. Die 
Verknupfung OU2 empfSngt auf ihrem anderen Eingang das 
invertierte Signal bloc. Die VerknUpfung OU3 empf&ngt auf 



41 



ihrem anderen Eingang das Signal bloc. Der Ausgang der 
Verknupfung 0U1 ist mit detn Freigabeeingang enl des 
Decodierers DEC1 verbunden, und der Ausgang des Rangs i 
dieses Decodierers DECl aktiviert einen Freigabe- "puffer" 
5 BVL vom Rang i. Der Ausgang der Verkntipfung 0U2 ist mit 
dem Freigabeeingang enO des Decodierers DECO und mit 
Freigabe-"puffern" BVE verbunden, Der Ausgang der 
Verknupfung OU3 ist mit verknupfungen ETl 0 . . . ET1 15 
verbunden, die auf ihxem anderen Eingang den 

10 entsprechenden Ausgang, der dem Rang des Decodierers DECO 
entspricht, empfangen. Der Ausgang i jeder VerknQpfung 
ET1 0 . . . ET1 15 1st mit dem Schreibeingang \/q ... w^s eines 
jeden Speichermoduls MC 0 ... MC X 5 verbunden. Ein Datenbus 
verbindet jedes Speichermodul MC 0 ... MC 15 mit einem der 

15 Freigabepuffer BVL und mit einem der Freigabepuf fer BVE. 
Der Ausgang der Puffer BVL und der Eingang der Puffer BVE 
empfangen parallel einen Datenbus datamot_MC (der mit dem 
Abf rage-Verwaltungsprozessor PGU verbunden ist) , 

Der im obigen Beispiel beschriebene Cache- 

20 Speicher funktioniert wie folgt: 
Ball I 

Die Anforderung kommt vom Verwaltungsprozessor 
des Seriendrahts PGS. Dieser Fall wird durch Vorhandensein 
eines logischen Null-Zustands auf dem Signal bloc 
' 25 signalisiert . 

Beim Lesen des Cache- Speichers legt der 
Verwaltungsprozessor des Seriendrahts PGS dem AdreSbus 
adr_MC die Adresse der zu lesenden Blockstelle vor {in 
diesem Fall wird nur der Teil adr_bloc des Busses adr_MC 
30 benutzt) und aktiviert das Lesesignal r_MC. Am Ende der 
Zugriffszeiten ist der Block auf dem Bus datablocJC 
verfugbar. 

Beim Schreiben in den Cache- Speicher legt der 
Verwaltungsprozessor des Seriendrahts dem AdreSbus adr_MC 
35 die zu schreibende Adresse der Blockstelle und dem 
Datenbus databloc__MC die darin einzuschreibenden Daten vor 
und aktiviert die Leitung w_MC. Der Null-Zustand des 
Signals bloc leitet das Signal w_MC uber die Verknupfungen 
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0U3 und ETli zu den Schreibsteuer-Eingangen der Module des . 
Cache- Speichers MC 0 ... MC 15 . Die auf dem Datenbus 
databloc_MC vorhandene Information wird am Ende der 
Schreibzeit in den Cache- Speicher eingeschrieben. 
5 Fall 2 

Die Anforderung kommt vom Abfrage- . 
Verwaltungsprozessor PGU des Verarbeitungs-Prozessors CPU. 
Dieser Fall wird durch Vorhandensein eines Logikzustands 
Eins auf dem Signal bloc signalisiert. 

10 Beim Lesen des Cache-Speichers legt der 

Verwaltungsprozessor PGU dem Bus adr_MC die Adresse des 
angeforderten Wortes vor und aktiviert das Lesesignal 
F_MC. Der dem Teil adr_bloc entsprechende Block wird im 
Cache -Spei cher gelesen, und das angeforderte Wort wird 

15 Qber einen der Freigabepuf fer BVL zum Datenbus datamot_MC 
geleitet. Der betreffende Freigabepuf fer BVL wird durch 
den Decodiererausgang DEC1 aktiviert, der der 
angeforderten Wortadresse adr_mot entspricht. 

Beim Schreiben in den Cache-Speicher legt der 

20 Verwaltungsprozessor PGU dem Bus adr_MC die Adresse des zu 
schreibenden Wortes vor und dem Datenbus datamot_MC die zu 
schreibenden Daten und aktiviert das Schreibsignal w_MC. 
Die auf dem Bus datamot_MC vorhandenen Daten werden uber 
den freigegebenen Puffer BVE durch das Schreibsignal auf 

25 jedes Modul des Cache-Speichers ausgesandt. Das 
Schreibsignal w__MC wird dann dem einzigen betrof f enen 
Speichermodul vorgelegt. Es wird an den Ausgang des 
Decodierers DEC0, der der betreffenden Adresse adr_raot 
entspricht, ausgegeben. 

30 In der oben beschriebenen Durchfuhrungsart 

sind die Zugrif f sprobleme in Byte und Doppel-Byte, und des 
Zugriffs in Doppel-Byte und in einem sich auf zwei 
Speichermodule erstreckenden Wort auf dieselbe Art und 
Weise gelost, wie in den traditionellen 

35 Datenverarbeitungssystemen und sind hier nicht 
beschrieben. 

Die Ab&Lldungen 12a, 12b, 12c und 12d stellen 
als Beispiel die Eigenschaf ten eines 
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Verwaltungsverzeichnisses des Cache- Speichers RG und eines 
zugeordneten Verwaltungsprozessors PGR dar. Abbildung 12a 
illustriert die iogische Struktur der Adresse adr_RG in 
der Annahme eines mit 32 Bit adressierten Bereichs und mit 
5 den zuvor beschriebenen Eigenschaf ten des Cache -Speichers. 
Das Peld - tag -, Bestandteil des Adrefiblocks , ist auf 18 
Bit codiert. Das Feld - Rahmen- ist auf 8 Bit codiert und 
ermoglicht die Adressierung der 256 Bloclcstellen des 
Cache-Speichers MC. Die letzten 6 Bit definieren die 

10 Wortadresse in dera Block in Byte-Einheiten. 

Abbildung 12b stellt die Struktur des 
Verwaltungsverzeichnisses des Cache-Speichers RG dar, der 
ein einf acher schneller Schreib-Lese-Speicher mit einer 
Kapazitfit von 256 WSrtern von je 22 Bit ist. Jedes Wort 

15 der Adresse i enthSlt das Stichwort des an der Stelle i 
des Cache-Speichers eingeschriebenen Blocks. 

Abbildung 12c schematisiert die Struktur des 
Stichworts, das folgendes enthSlt: 

ein Peld tag von 18 Bit, das die 

20 Blockadresse in der g&ngigen Blocks telle oder dem gangigen 
Blockrahmen definiert, 

- das Freigabebit v, 

- das Modifikationsbit m, 

- das Wartebit des Transferendes a, 

25 - das Wartebit fur die vollstandige Entladung. - 

Abbildung 12d liefert die Struktur des 
Prozessors PGR, der nichts anderes ist, als ein 
herkoraralicher Arbiter mit f eststehender Prioritat. 

Dieser Arbiter urafaSt ein LATCH-Register, von 

30 dem drei Eingange das Signal rqst_UR, rqstJPR 
beziehungsweise rqst_SR empfangen, das ebenfalls zur 
Verknupfung ET2, ET3 beziehungsweise ET4 ausgegeben wird. 
Die entsprechenden Ausgange des IATCH-Registers sind mit 
den EingSngen eines Priori tStencodierers PRI verbunden, 

35 dessen Ausg&nge niit den Eing&ngen eines Decodierers DECPRI 
verbunden sind. Die Ausgange des LATCH -Registers, deren 
Rang denen der Ausgange entsprechen, sind mit den Signalen 
grnt_UR, grnt_PR und grnt_SR verbunden sowie, invertiert, 
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rait den Eing&ngen der Verkntipfung ET2, ET3 beziehungsweise 
ET4. Die Ausgange der Verknupfungen ET2, ET3 und ET4 siad 
rait den Bingfingen der Verknupfung N0U1 verbunden. Der 
Ausgang der Verknupfung NOU1 ist mit einer Kippschaltung 
5 Bl verbunden, die auf ihretn Eingang D den Ausgang eO des 
Priori t at encodierers PRI empfangt. Die ganze Vorrichtung 
wird durch einen allgemeinen Taktgeber synchronisiert, der 
ein Signal h an einen der EingSnge elk einer Verknupfung 
ET5 ausgibt und, invertiert, an den Taktgebereingang der 

10 Kippschaltung Bl ausgibt. Der Ausgang Q der Kippschaltung 
Bl ist rait dera anderen Eingang der Verknupfung ET5 
verbunden. Der Ausgang der Verknupfung ET5 ist rait dem 
Eingang load des LATCH- Registers verbunden. 

Dieser Arbiter funktioniert wie folgt: ist 

15 keine Abfrage auf den Leitungen rqst vorhanden, dann 
speichert die Kippschaltung Bl permanent den Zustand der 
inaktiven Leitung e(f und gibt so durch die Verknupfung ET5 
das Laden des LATCH-Registers frei. 

Die Ankunft eines Signals rqst bewirkt die 

20 Blockierung des Taktgebers und die Aktivierung des Signals 
grnt, das dera Signal rqst zugeordnet ist, und zwar bis zur 
Inaktivierung dieses letzteren: der Arbiter bleibt wahrend 
der gesaraten Dauer der sich ira Gang befindlichen 
Transaktion in seinera Zustand • 

25 Der in Abbildung 13 dargest elite Abfrage - 

Verwaltungsprozessor PGU, bildet eine Schnittstelle 
zwischen dera Verarbeitungs-Prozessor CPU und: 

- einerseits den verschiedenen Prozessoren, 
mit denen er Inf orraationen austauschen trtufi: paralleler 

30 Verwaltungsprozessor PGP, Serien- Verwaltungsprozessor PGS 
und Verzeichnis -Verwaltungsprozessor des Cache -Speichers 
PGR, 

- andererseits dem Verwaltungsverzeichnis des 
Cache -Speichers RG und dem Cache-Speicher MC. 

35 Der Verarbeitungs-Prozessor CPU 16st durch 

Aktivierung des Signals as ("address strobe") die 
Aktivitat des Abf rage-Verwaltungsprozessors PGU aus. 
Dieses Signal gibt den Adrefibus adr_CPU, die Lesesignale 
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r^CPU und Schreibsignale w"_CPU sowie die 
Funktionsleitungen fc_CPU des Verarbeitungs-Prozessors CPU 
frei. Der Verarbeitungs-Prozessor CPU geht dann bis 2um 
Quittieren der Abfrage durch das Signal dtack_CPU in den 
5 Wartezustand. 

Das Signal as 1st mit dem Eingang eines 
Dif ferenzierers D10 verbunden. Der Ausgang dieses 
Dif ferenzierers ist an einen der drei Eingange einer 
Verknupfung ET12 angeschlossen, und die beiden anderen 

10 EingSnge empfangen das Signal ackJJS beziehungsweise 
ackJDP . Dieses letztere Signal wird auch an den Eingang R 
einer Kippschaltung B13 ausgegeben. Der Eingang "s der 
Kippschaltung B13 empf§ngt den Ausgang einer Verknfipfung 
NET10. Der Ausgang der Verknupfung ET12 ist rait dem 

15 Eingang s" einer Kippschaltung Bll, mit dem Eingang sf der 
Kippschaltung BIO und rait dem Eingang clearlO eines 
Schieberegisters SR10 verbunden. Der Ausgang Q der 
Kippschaltung Bll liefert das Signal rqstJOR. Die 
Kippschaltung Bll erapf&ngt auf ihrem Eingang R die 

20 invertierte Phase thetal3 und die Kippschaltung BIO die 
invertierte Phase thetall. Der Ausgang Q der Kippschaltung 
BIO ist mit dem Serieneingang s6rial_inl0 des Registers 
SR10 verbunden. Das Schieberegister SR10 empfangt auf 
seinem Eingang clklO das Taktgeber signal -h- und auf 

25 seinem Freigabeeingang enlO das Signal grnt_UR. 

Die Aktivierung des Signals as ldst den 
Dif ferenzierer D10 aus. Der durch diesen Dif ferenzierer 
erzeugte Iinpuls geht durch die Verkntipfung ET12 , versetzt 
die Kippschaltungen BIO und Bll durch ihren Eingang IT in 

30 den Logikzustand Bins und fuhrt auch das Zurucksetzen auf 
Null des Schieberegisters SR10 durch seinen Eingang 
clear 10 durch . 

Die Kippschaltung BIO und das Schieberegister 
SR10 bilden die Logikunterbaugruppe "Phasenverteiler" 

35 DP_U. Die Aktivierung dieses Phasenverteilers wird dadurch 
ausgeldst, da£ die Kippschaltung BIO auf Eins gesetzt und 
das Schieberegister SR10 auf 0 zuruckgesetzt wird. Ist das 
Schieberegister durch das Vorhandensein eines Nullzustands 
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auf seinem Eingang enlO freigegeben worden, dann bewirkt 
der n&chste Itnpuls des Taktgebers h auf den Eingang elk 
des Schieberegisters die Verschiebung urn einen Schritt des 
besagten Registers. 
5 . Der Logikzustand Eins der Kippschaltung BIO 

wird auf dem Ausgang thetall des Schieberegisters SR10 
durch seinem Serieneingang serialinlO weitergegeben. Der 
Ausgang thetall, als invertierte Phase thetall bezeichnet, 
setzt die Kippschaltung BIO durch ihren Eingang *R auf Null 

10 zuruck. So wird bei jeder Aktivierung des Phasenverteilers 
DP_U in das Schieberegister SR10 ein einziges Bit 
eingegeben. Bei jedem Impuls des Taktgebers h verschiebt 
sich dieses Bit in dem Schieberegister SR10 und erzeugt 
die aufeinanderfolgenden getrennten Phasen thetall, 

15 thetal2 und thetal3. 

Das Setzen in den Logikzustand Eins der 
Kippschaltung Bll bewirkt die Aktivierung des Signals 
rqstJJR. Dieses Signal wird . an den Verzeichnis- 
Verwaltungsprozessor PGR gesandt. Dieser letztere wird 

20 durch Aktivierung des Signals grnt_UR sobald wie mSglich 
den Zugriff auf das Verwaltungsverzeichnis R6 und auf den 
Cache- Speicher MC geben; dieses Signal gibt alle 
Obergabepuf fer BV10, BV11 und BV12 frei, die sich auf den 
Bussen des Verwaltungsregisters beziehungsweise auf den 

25 Bussen des Cache -Speichers befinden. Dieses Signal grnt_UR 
gibt ebenfalls den Phasenverteiler frei, der dann 
sequentiell die Phasen thetall, thetal2 und thetal3 
erzeugt. 

Die Phase thetall entspricht einer 
30 Zeitverz&gerung, die das Lesen des Stichworts des durch 
den Verarbeitungs-Prozessor CPU im Verwaltungsverzeichnis 
RG angeforderten Blocks ermoglicht , der durch das 
Rahmenfeld der Adresse adr_CPU adressiert ist und mit dem 
Bus adr_RG uber die Obergabepuf fer BV10 verbunden ist. Das 
35 Signal F_RG ist itraner am Eingang eines Puffers BV10 aktiv, 
das Signal ~_RG am Eingang eines Puffers BVlO immer 
inaktiv. Am Ende der Zeitverzogerung, wird dem Prozessor 
PGU das Stichwort uber den Bus data_RG gesandt. Der Teil 
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tag dieses Stichworts und das Freigabebit v werden an 
einen der Vergleichseing&nge eines Komparators COMP10 
ausgegeben, wobei der andere Eingang mit dem Teil tag der 
Adresse adr_CPU verbunden ist. Das dem Freigabebit v 
5 gegentiberliegende Bit ist imraer auf Bins. Der Koraparator 
COMPlO wird durch Vorhandensein eines Zustands Eins auf 
seinem Eingang enll permanent freigegeben. 

Die Zugriffsdauer auf das 

Verwaltungsverzeichnis RG und die Taktgeberfrequenz h 

10 verhalten sich so zueinander, da£ am Ende der Phase 
thetall, der Ausgang eglO des Komparators COMPlO 
positioniert wird und die Information "der angeforderte 
Block ist im Cache -Speicher vorhanden oder im Cache- 
Speicher nicht vorhanden" lief ert. 

15 Ist der angeforderte Block im Cache -Speicher 

MC (eglO = 1) vorhanden, dann liefert das Signal eglO, das 
an einen der beiden EingSnge der Verknupfung ET10 
ausgegeben wird, ein durch die Phase thetal2 kalibriertes 
Signal, die Phase ist auf dem anderen Eingang der 

20 Verknupfung ET10 vorhanden. 

Dieses auf dem Ausgang der Verkn&pfung ET10 
vorhandene kalibrierte Signal ist mit den Eingangen der 
Verknupfungen NET10, NET11 und NET12 verbunden. 

Die Verknupfung NET10 empfangt auf ihren 
' 25 Eingangen, auEer dem Ausgang der Verknupfung ET10, das 
invertierte Zustandsbit m aus dem Stichwort und das 
invertierte Schreib-Anf orderungssignal *TCPU. 

Die Aktivierung der Verknupfung NET10 
entspricht dem Zustand n Schreib-Anf orderung eines Wortes 

30 in einen Block, der in dem Cache -Speicher vorhanden ist 
und der noch nicht modifiziert worden ist (m « 0) n . Der 
Ausgang der Verknupfung NET10 ist mit dem Eingang S einer 
Kippschaltung B13 verbunden. Die Aktivierung der 
Verknupfung NET10 setzt die Kippschaltung B13 in den 

35 Logikzustand Eins, was durch die Leitung rqst_UP eine 
Infomiations-Schreib-Abf rage beira Verwaltungsprozessor des 
parallelen Draht's PGP ausldst. Die betreffende 
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. Blockadresse wird uber die Leitungen adrJblocJJP 
geliefert, eine Abzweigleitung der Leitungen adr_CPU. 

Der Abfrage-Verwaltungsprozessor PGU hat den 
erst en Teil seiner Aufgabe beendet: das 
5 Verwaltungsverzeichnis RG und der Cache- Speicher werden 
durch Inaktivierung des Signals rqst_UR freigemacht, die 
Polge des Erapfangs der invertierten Phase thetal3 auf dem 
Bingang R der Kippschaltung Bll . 

Der Informations -Schreibmechanismus wird im 

10 Abschnitt "Verwaltungsprozessor des parallelen Drahts PGP" 
beschrieben und bewirkt das Setzen des angeforderten 
Blocks in den "modifiziert" -Zustand (ra = 1) oder 
"ungiiltig"- Zustand (v ■ 0) . Es kann festgestellt werden, 
da& die Freimachung des Verwaltungsverzeichnisses RG und 

15 des Cache-Speichers MC durch den Abfrage- 
Verwaltungsprozessor PGU notwendig ist, damit der 
Verwaltungsprozessor des parallelen Drahts PGP darauf 
Zugriff nehmen kann. Das Ende der Operation 0 Informations - 
Schreibvorgahg" wird dem Abfrage-Verwaltungsprozessor PGU 

20 durch Aktivierung des Signals ack_UP signalisiert , wodurch 
die Kippschaltung B13 auf Null zurilckgesetzt wird und 
durch die Verknupfung ET12 die Kippschaltung Bll und der 
Phasenverteiler aktiviert wird: der anfangs durch . das 
Signal as gestartete Zyklus l&uft erneut ab, jedoch wird 

25 die Sequenz, eine Folge der Aktivierung der Verknupfung 
NET10, in diesem Abfragezyklus nicht ein zweites Mai 
durchlaufen. 

Die Verknupfung NETll empfangt auf ihren 
Bingangen, aufier dem Ausgang der Verknupfung ET10, das 
30 Zustandsbit m aus dem Stichwort und das invertierte 
Schreib-Anforderungssignal wJIPU . 

Die Aktivierung der Verknupfung NETll 
entspricht dem Zustand "Schreib-Anforderung in einen im 
Cache- Speicher vorhandenen Block, der bereits modifiziert 
35 worden ist n . 

Der Ausgang der Verknupfung NETll ist durch 
einen der Puffer BVll hindurch mit dem Schreibsignal w_MC 
des Cache-Speichers MC verbunden. Dieses Signal ermoglicht 
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das Schreiben der auf dem Bus data_MC vorhandenen Daten im 
Cache -Spei cher an der auf dem Bus adr_MC vorhandenen 
Adresse, wobei der Bus data_MC rait dem Bus data_CPU uber 
die bidirektionalen Puffer BV12 und der Bus adr_MC mit dem 
5 Bus adr_CPU uber die Puffer BVll verbunden sind. Die 
Aktivierungsrichtung dieser Puffer wird durch das Signal 
wJC geliefert. 

Der Ausgang der Verknupfung NETll ist 
ebenfalls mit einem der EingSnge der Verknupfung ETll 

10 verbunden, die so dem . Verarbeitungs-Prozessor CPU das 
Signal dtack_CPU zurucksendet . Der Schreibvorgang in den 
Cache-Speicher erfolgt parallel zu der Aktivierung des 
Signals dtackJZPU, was den gewohnlichen Spezif ikationen 
der Verarbeitungs-Prozessoren entspricht. 

15 Die Operation wird durch das Freimachen des 

Verwaltungsverzeichnisses RG und des Cache -Speichers MC 
beendet, und zwar durch Inaktivieren des Signals rqst_UR, 
eine Folge des Empfangs der invertierten Phase theta!3 auf 
der Kippschaltung BU. 

20 Die Verknupfung NET12 empfangt auf ihren 

Eing&ngen, aufier dem Ausgang der Verkmipfung ET10, das 
invertierte Lese-Anforderungssignal r_CPU. Die Aktivierung 
der Verknupfung NET12 entspricht dem Zustand "Anforderung 
zum Lesen eines Worts in einem im Cache-Speicher 

25 vorhandenen Block" . 

Die nachfolgenden Operationen sind identisch 
mit den vorangegangenen, wobei der einzige Unterschied das 
der Tranferrichtung der Daten. auf den Bussen data_CPU und 
data_MC zugeordnete aktivierte Signal (r_MC anstatt w_MC) 

30 ist. 

Ist der angeforderte Block nicht im Cache- 
Speicher vorhanden (eglO ■ 0), dann liefert das 
invertierte Signal eglO, das mit einem der beiden EingSnge 
der Verknupfung NET13 verbunden ist, ein durch die Phase 
35 thetal2 kalibriertes Signal; diese Phase ist auf «dem 
anderen Eingang der Verknupfung NET13 vorhanden. Der 
Ausgang der Verknilpfung NET13 ist mit dem Eingang s" der 
Kippschaltung B12 verbunden. Dieses kalibrierte Signal 
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setzt die Kippschaltung B12 auf Bins, was das Senden einer 
Dienstabfrage rqsFjJS zum Verwaltungsprozessor des 
Seriendrahts PGS bewirkt. Dieser Prozessor eznpf&ngt auf 
den Leitungen adr_bloc_US ebenfalls die abzufragende 
5 Blockadresse und auf den Leitungen wjJS, rJJS und fc_US 
die Art der Abfrage. 

Der Abfrage-Verwaltungsprozessor PGU hat den 
ersten Teil seiner Aufgabe beendet: das 
Verwaltungsverzeichnis RG und der Cache-Speicher MC werden 

10 durch . Inaktivierung der Leitung rqst_UR freigeraacht, eine 
Folge des Empfangs der invertierten Phase thetal3 auf der 
Kippschaltung Bll. 

Der Update-Mechanismus des Cache-Speichers ist 
im Abschnitt "Verwaltungsprozessor der Serienverbindung 

15 PGS" beschrieben. 

Man kann feststellen, daB das Preiraachen des 
Verwaltungsver2eichnisses RG und des Cache-Speichers MC 
notwendig ist, damit der Verwaltungsprozessor der 
Serienverbindung PGS darauf Zugriff nehmen kann. 

20 Das Update des Cache-Speichers wird dem 

Abfrageprozessor PGU durch Aktivierung des Signals ack_US 
signalisiert , Dieses Signal wird an den Bingang R der 
Kippschaltung B12 und an den Bingang der Verkntipfung ET12 
ausgegeben. Bs setzt so die Kippschaltung B12 auf Null 

25 zuruck und aktiviert durch die Verkndpfung BT12 die 
Kippschaltung Bll und den Phasenverteiler : der anfangs 
durch das Signal as gestartete Zyklus wird erneut 
durchlaufen, jedoch dieses Mai aufgrund des Vorhandenseins 
des Blocks im Cache- Speicher mit Erfolg. 

30 Der Serienverwaltungsprozessor PGS, der als 

Beispiel in Abbildung 14 dargestellt ist, hat die Aufgabe, 
die Serienverbindung LS zu verwalten und zu diesem Zweck 
die Anforderungen fur den Blocktransf er zwischen dem 
Hauptspeicher RAM und dem Cache -Speicher MC und die 

35 entsprechenden Updates im Verwaltungsverzeichnis RG 
durchzuf uhren . Er verarbeitet an erster Stelle die 
Anforderungen aus ' dem Spionprozessor PE, die in einer 
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Warteschlange FIFO warten. Er verarbeitet ebenso die 
Anforderungen aus dem Abfrageprozessor PGU. 

Dieser Verwaltungsprozessor der 

Serienverbindung PGS umfaSt eine Kippschaltung B20, die 
5 auf ihrem Dateneingang D das Signal empty aus der 
Warteschlange FIFO und auf ihrem Taktgebereingang den 
Ausgang Q einer Kippschaltung B22 empfangt. Eine 
Kippschaltung B21 empfangt auf ihrem Dateneingang den 
Ausgang einer Verknflpfung OU20. Diese Verknupfung OU20 

10 gibt das Signal rqst_US frei, das sie auf einem ihrer 
beiden EingSnge empfangen hat, wobei der andere Eingang 
mit dem Signal empty verbunden ist. Der Taktgebereingang 
der Kippschaltung B21 koirant aus dem Ausgang Q der 
Kippschaltung B22. Der Ausgang <Q der Kippschaltung B22 ist 

15 an ihrem Dateneingang D zur Schleife geschaltet, was sie 
als Frequenzteiler durch zwei bedingt . . Der 
Taktgebereingang der Kippschaltung B22 ist an den Ausgang 
einer Verknupfung ET20 angeschlossen, die auf einem ihrer 
Eing&nge den allgemeinen Betriebstaktgeber h und auf dem 

20 anderen Eingang ein Freigabesignal empfangt. Dieses 
Freigabe signal kommt vom Ausgang einer Verkmipfung ET24, 
die auf ihren beiden Eingangen den Ausgang "q 
beziehungsweise Q der Kippschaltungen B20 und B2l 
empfangt. 

) 25 Die Kippschaltung B20 empf&ngt auf ihrem 

Eingang "R die invertierte Phase theta25 aus einem 
Phasenverteiler DP_S. Die Kippschaltung B21 empfangt auf 
ihrem Eingang s" den Ausgang einer Verknupfung NOU20. Diese 
Verknupfung NOU20 empfangt auf ihren beiden Eingangen den 

30 Ausgang der Verkniipfung ET22 beziehungsweise ET23. Die 
Verknupfung ET22 empfangt auf ihren EingSngen die Phase 
theta25 aus dem Phasenverteiler und das Signal raaj aus 
einer Verknupfung ET29. Die Verknupfung ET23 empfangt auf 
ihren Eing&ngen die Phase theta27 aus dem Phasenverteiler 

35 und das invertierte Signal ma j . 

Die Bauteile B20, B21, B22, ET20, ET22, ET23, 
OCJ20, ET24 und NOU20 bilden zusammen einen Arbiter mit 
einer festen PrioritSt ARB_S. Er funktioniert wie folgt: 
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die Kippschaltung B22 lief ert auf ihren Ausgangen If und Q 
wechselnde Signale mit einer Frequenz , die ha Lb so grofi 
ist, wie die des allgemeinen Taktgebers. Diese Signale 
geben abwechselnd die Kippschaltungen B20 und B21 frei. 
5 Ist eine Dienstabf rage auf einem der EingSnge der 
Kippschaltungen B20 oder B2l vorhanden, dann speichem 
diese wechselnden Signale die Anforderung in der 
entsprechenden Kippschaltung (B20 fxir den Spionprozessor 
PE und B21 fir den Abfrage-Verwaltungsprozessor PGU) , die 

10 daraufhin den wechselnden Betrieb blockiert. Es ist 
festzustellen, daS das Signal rqst_US, das vora Abfrage- 
> Verwaltungsprozessor PGU koramt, durch das Signal empty 
Clber die Verknupfung OU20 bedingt wird: dieses Signal wird 
dann nur in Betracht bezogen, wenn die Warteschlange FIFO 

15 leer ist. Die Kippschaltung B20 (beziehungsweise B21) wird 
auf Null nur zurilckgesetzt, wenn die auszufuhrende 
Transaktion beendet ist . 

Die Verteilung einer Anforderung auf der einen 
oder anderen der beiden Kippschaltungen B20 und B21 zeigt 

20 sich durch eine Zustandsanderung des Ausgangs der 
Verknupfung ET24. Der Ausgang der Verknupfung ET24 ist 
ebenfalls mit einem Dif ferenzierer D20 verbunden, der 
wahrend der Zustands&nderung des Ausgangs der Verknupfung 
ET24 einen Impuls ausgibt. Der Ausgang des Dif f erenzierers 
) 25 ist einerseits mit dem Phasenverteiler DP_S (Eingang IF 
einer Kippschaltung B36 und clr20 eines Schieberegisters 
SR20) des Verwaltungsprozessors der Serienyerbindung 
verbunden und andererseits mit einem der beiden Eingange 
der Verknupfung OU22. Der Ausgang der VerknOpfung ist mit 

30 den Eingangen S der beiden Kippschaltungen B24 und B25 
verbunden. Die Kippschaltung B24 empffingt auf ihrem 
Eingang R den Ausgang einer Verknupfung NOU21 und die 
Kippschaltung B25 empfSngt das Signal grnt_SR . Die 
Verknupfung NOU21 empf&ngt auf ihren beiden Eingangen die 

35 Ausgange von Verkntipfungen ET36 und ET37. Die Verknupfung 
E36 empfangt auf ihren Eingangen die Phase theta23, die 
aus dem Phasenverteiler kommt, das Signal ma j , die 
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Verknupfungen E37, die Phase theta27, die aus dem 
Phasenverteiler kommt, und das invertierte Signal maj . 

Der aus dem Dif f erenzierer D20 kotnmende Impuls 
initial isiert so den Phasenverteiler und setzt eine der 
5 Kippschaltungen B24 und B2S uber die Verknupfung 0U22 in 
den Logikzustand Eins. 

Der Phasenverteiler DP_S setzt sich aus dem 
Schieberegister SR20 und der Kippschaltung B36 zusammen. 
Er funktioniert genauso wie der ira Abschnitt uber den 
10 Abfrage-Verwaltungsprozessor PGU beschriebene . 

Der Ausgang Q der Kippschaltung B24 ist mit 
dem Signal rqst_SR, das fQr den Verzeichnis- 
Verwaltungsprozessor PGR bestimmt ist, verbunden. Seine 
Aktivierung lost eine Dienstanf orderung an diesen 
15 Prozessor aus, der fiber die Leitung grnt_SR antwortet, die 
ihrerseits mit dem Eingang R der Kippschaltung B25 
verbunden ist. Der Ausgang Q der Kippschaltung B25 ist mit 
einem der Eingange einer Verknupfung OU23 verbunden. Der 
Ausgang der Verknupfung 0U23 ist mit dem Eingang en20 des 
20 Schieberegisters SR20 verbunden. 

Die Logikgruppe B24 und B25 bilden zusammen 
eine Logik RESYNC_S fur die erneute Synchronisation 
zwischen asynchronen Einheiten. Sie funktioniert 
f olgendermaEen : 

25 Eine Dienstanf orderung rqst_SR an den 

Verzeichnis -Verwaltungsprozessor PGR erfolgt durch 
Aktivierung der Kippschaltungen B24 und B25 iiber die 
Verknupfung OU22, was zwei Aktiviemngsquellen zul§£t. Die 
Logik des Verzeichnis -Verwaltungsprozessors PGR sorgt 

30 innerhalb einer nicht bestimmten Zeitdauer fur eine 
Antwort grnt_SR, die die Kippschaltung B25 auf Null 
zurucksetzt. Die Kippschaltung B24 halt bis zu ihrem 
Zurucksetzen auf Null ihre Anforderung durch Aktivierung 
ihres Eingangs *R aufrecht. Dafur inaktiviert der 

35 Verzeichnis-Verwaltungsprozessor PGR seine Leitung 
grnt_SR: die Resynchronisationslogik ist bereit fur eine 
ndchste Dienstanf orderung. Der Ausgang Q der Kippschaltung 
B25 dient dazu, den Phasenverteiler durch Betatigen seines 



54 



Eingangs exx20 uber die Verknupfung 0U23 zu blockieren: das 
Zurucksetzen auf Null der Kippschaltung B25 macht den 
Phasenverteiler frei, der die erste Phase theta2l wSLhrend 
des n§chsten aktiven Ubergangs des allgemeinen Taktgebers 
5 h, der an den Eingang clk20 des Phasenverteilers 
angeschlossen ist, liefert. 

Die Leitung grnt_SR 1st ebenfalls mit den 
Freigabepuffern BV20, BV25 und BV21, BV22 verbunden, die 
den Zugrif f zum Vervaltungsverzeichnis RG beziehungsweise 

10 zum Cache-Speicher MC dffnen. 

1st die Kippschaltung B20 aktiv, dann ist die 
sich im Gang befindliche Transaktion ein vollstSndiges 
Entladen des Blocks, die vom Spionprozessor PE uber die 
Warteschlange FIFO angefordert worden ist. Der Ausgang Q 

15 der Kippschaltung B20 ist mit den Freigabepuffern BV24 
verbunden. Diese Puffer empfangen auf ihrem Eingang den 
Ausgang eines Registers REG20 . Der Ausgang Q der 
Kippschaltung B20 ist mit einem der beiden Eingfinge einer 
Verkniipfung OU21 verbunden, die auf ihrem anderen Eingang 

20 den Ausgang des Diff ernzierers D20 empfingt. Der Ausgang 
der Verknupfung OU21 ist mit dem Eingang load20 des 
Registers REG20 und dem Eingang read20 der Warteschlange 
FIFO verbunden. 

So bewirkt die Aktivierung der Kippschaltung 

25 B20: 

1. Die Initialisierung des Phasenverteilers, 

2. Eine Anforderung fur den Zugrif f auf das 
Verwaltungsverzeichnis RG und auf den Cache-Speicher MC, 

3. Das Laden des ersten Elements der 
30 Warteschlange FIFO in das Register REG20 und das Vorrucken 

der Warteschlage, 

4. Die Freigabe des Puffers BV24: der Bus 
adrJC enth&lt die zu entladende Blockadresse. Die Art der 
Operation (Update) wird anhand der Korabination der Bits v 

35 und m (Signal maj) gefunden. 

1st die Kippschaltung B21 aktiv, dann stammt 
die sich im Gang befindliche Transaktion aus einem 
Infortaationsmangel im Cache-Speicher MC. Der Ausgang Q der 
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Kippschaltung B21 ist mit Freigabepuffern BV23 verbunden. 
Diese Puffer empfangen auf ihrem Bingang die vora Abfrage- 
Verwaltungsprozessor PGU stammenden Informationen. 

So bewirkt die AJctivierung der Kippschaltung 
5 B21 folgendes: 

1. Die Initialisierung des Phasenverteil ers, 

2. Bine Anforderung fur den Zugriff auf das 
Verwaltungsverzeichnis RG und zum Cache- Speicher MC, 

3- Die Freigabe der Puffer BV23: der Bus adrJC 

10 enth&lt die Blockadresse, die den Informationsmangel im 
Cache- Speicher MC bewirkt hat, und die Art der Abfrage: 
Lesen Oder Schreiben, geteilte Oder nicht geteilte Daten 
(Leitungen fc_US) . 

Das Feld "Rahmen" des Busses adr_X ist uber 

15 die Freigabepuffer BV20 mit den Adressenleitungen adr_RG 
des Verwaltungsverzeichnisses RG verbunden. Die Ausgange Q 
der Kippschaltungen B26 und B27 sind Ober die 
Freigabepuffer BV20 mit der Leitung r_RG beziehungsweise 
w_RG des Verwaltungsverzeichnisses verbunden. Die 

20 Kippschaltung B26 erapfangt auf ihrem Eingang s" den Ausgang 
der Verknupfung OU22 und auf ihrem Eingang *R die 
invertierte Phase theta22, die aus dem Phasenverteiler 
kommt. Die Kippschaltung B27 empfSngt auf ihrem Bingang S" 
den Ausgang einer Verkntipfung NOU22 und auf ihrem Bingang 

25 R den Ausgang einer Verknupfung NOU23 . Die Verknupfung 
NOU22 empf Sngt auf ihren beiden Eingangen den Ausgang der 
Verknupfung ET25 beziehungsweise ET26, die ihrerseits auf 
ihren Eingangen, was die Verknupfung ET25 betrifft, die 
Phase theta22 und das Signal maj empfangen und, was die 

30 Verknupfung ET26 betrifft, die Phase theta26 und das 
Signal maj . Die Verknupfung NOU23 empf angt auf ihren 
beiden Eingangen den Ausgang der Verknupfung ET27 
beziehungsweise ET2 8, die ihrerseits auf ihren Eingfingen, 
was die Verknupfung ET27 betrifft, die Phase theta23 und 

35 das invertierte Signal maj empfangen und, was die 
Verknupfung ET28 betrifft, die Phase theta27 und das 
invertierte Signal maj . 
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Das Peid tag des Busses adr_X ist fiber 
Freigabepuffer BV25 mit dem Peld tag der Leitungen data_RG 
verbunden. Diese letzteren empfangen auf ihrem 
Freigabeeingang den Ausgang einer Verknupfung 0U24 r die 
5 auf ihren Eing&ngen das Signal grnt_SR und den Ausgang Q 
der Kippschaltung B27 empfangt. 

Die Eing&nge D von Kippschaltungen B28 und B29 
sind mit der Leitung des Freigabebits v beziehungsweise 
des Modif ikationsbits m des Busses data_RG verbunden. Die 

10 TaktgebereingSnge der Kippschaltungen B28 und B29 sind mit 
der Phase theta22 des Phasenverteilers verbunden. Der 
Ausgang Q der Kippschaltung B28 und der Ausgang Q der 
Kippschaltung B29. sind mit den beiden Eing&ngen einer 
Verknupfung ET29 verbunden, die auf ihrem Ausgang das 

15 Signal maj liefert. Eine Verknupfung OU25 empf&ngt auf 
ihren Eingangen das Signal maj und den Ausgang Q" einer 
Kippschaltung B30. Der Ausgang der Verknupfung OU25 ist 
mit dem Auswahleingang sel20 eines Multiplexers MUX20 
verbunden, der auf seinen beiden DateneingSngen den 

20 Ausgang Q der Kippschaltung B28 (Bit v) und die Konstante 
0 empfangt, wobei die Konstante Null gewahlt vrird, wenn 
sich der Auswahleingang sel20 im Logikzustand Eins 
befindet. Der Ausgang des Multiplexers MUX20 ist mit der 
Leitung des Freigabebits v des Busses adr_X. verbunden. Die 

25 Leitung des Wartebits -a- des Busses adrJC wird in den 
Logikzustand Null gesetzt. Das Modifikationsbit -m- ist 
rait der Lese-Leitxuig F_adr_x des Busses adr_X verbunden. 

Die gesamte oben beschriebene Logik bildet die 
Logik far den Zugriff und das Update des 

30 Verwaltungsverzeichnisses RG. Sie funktioniert wie folgt: 
die Aktivierung des Signals grnt_SR, die den Zugriff auf 
das Verwaltungsverzeichnis und den Cache- Speicher erlaxibt, 
gibt die Freigabepuffer BV20 frei. Das Lesen des 
betreffenden Stichworts wird vom Anfang der 

35 Zugrif fserlaubnis bis zur Ankunft der Phase theta22 
gesteuert, die dem Moment der Einspeicherung der Bits -v- 
und -m- in die Kippschaltungen B28 und B29 entspricht. Der 
koinbinierte Zustand dieser beiden Bits erzeugt durch die 
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Verknupf ungen ET29 das Signal maj , das den Fortlauf der 
Operationen bedingt. 

1. Fall : maj = 1* Dieser Fail koinmt vor, wenn 
sowohl das Freigabebit als auch das Modif ikationsbit den 
5 Wert 1 hat. Dieser Fall entspricht entweder einer 
Anforderung nach vollstandigem Entladen des Blocks des 
Spionprozessors PE Oder aber einem Informationsraangel, der 
vom Abfrage-Verwaltungsprozessor PGU an einer belegten und 
modif izierten BlocJcstelle festgestellt wird: in beiden 

10 Fallen raufi der betreffende Block in den Hauptspeicher RAM 
eingeschrieben werden, 

Dazu ist das Feld -Rahmen- des Busses adr_X 
uber die Freigabepuffer BV21 mit den Leitungen adr_MC 
verbunden. Die Ausgange Q der Kippschaltungen B30 und B31 

15 sind mit der Leitung r_MC beziehungsweise w_MC des Cache- 
Speichers MC verbunden, und zwar durch die Freigabepuf fer 
BV21. Die Leitung bloc wird uber einen der Freigabepuf fer 
BV21 auf Null gesetzt. Die Datenleitungen data_MC des 
Cache- Speichers sind uber die bidirektionalen 

20 Freigabepuffer BV22 mit den Eingangen des Schieberegisters 
RDP und mit den Ausgangen der Freigabepuffer BV26 
verbunden, die auf ihren Eingangen die 'Ausgangsleitungen 
des Schieberegisters RDP empfangen. Die Puffer BV22 werden 
durch die Leitung grnt_SR freigegeben und ihre 
. •> 25 Freigaberichtung wird durch den Ausgang Q der 
Kippschaltung B31 gesteuert. Die Kippschaltung B30 
empf Sngt auf ihren Eingangen S* und R die invert ierte Phase 
theta21 beziehungsweise theta23, die aus dem 
Phasenverteiler kommen. Die Kippschaltung B31 empfangt auf 

30 ihren Eingangen S und R die Ausg&nge der VerknOpfung ET32 
beziehungsweise ET33. Die Verknupfung ET32 empfclngt auf 
ihren Eingangen die Phase theta26 und das invert ierte 
Signal maj, die Verknupf ungen ET33 die Phase theta27 und 
das invert ierte Signal maj . Eine Verknupfung NET20 

35 empfangt auf ihren Eingangen die Phase theta23 und das 
Signal maj . Der Ausgang einer Verknupfung ET35 steuert die 
Freigabepuffer BV26 und empfangt auf ihren beiden 
Eingangen das invertierte Signal maj beziehungsweise den 
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Ausgang Q der Kippschaltung B31. Der Ausgang der 
Verknupfung NET20 ist mit dem Signal load21 des 
Schieberegisters RDP und mit dem Eingang S einer 
Kippschaltung B32 verbunden. Der Eingang *R dieser 
5 Kippschaltung B32 erapf Sngt das Signed f in_transf ert_raaj 
aus der Logik TFR, die dem Schieberegister RDP zugeordnet 
ist. Der Ausgang Q der Kippschaltung B32 ist mit einem der 
Eingange der Verknupfung OU23 verbunden. 

Die oben beschriebene Logik ermoglicht das 

10 vollstandige Entladen eines Blocks des Cache-Speichers. Es 
funktioniert folgendermaSen: 

Parallel zu dem Zugriff auf das 
Verwaltungsverzeichni6 RG, wird durch die Leitung FMC, 
die aus der Kippschaltung B30 kommt, ein Lesevorgang des 

15 Cache -Speichers MC aktiviert, und zwar wShrend der Phasen 
theta21 und theta22 . Am Ende dieses Lesevorgangs werden 
die gelesenen Daten, die den zu entladenden Block 
darstellen, am Eingang des Schieberegisters RDM vorgelegt. 
Die Aktivierung des Signals maj , dessen Zustand zu Anf ang 

20 der Phase theta22 bekannt ist, bewirkt folgendes: 

1. Das Ungultigmachen des Blocks ira 
Verwaltungsverzeichnis: da sich der Eingang sel20 des 
Multiplexers MUX20 im Logikzustand Eins befindet, wird das 
Preigabebit auf Null gesetzt und das Stichwort wird bei 

} 25 der Aktivierung des Signals w_RG, die durch die 
Kippschaltung B27 wahrend des Zyklus theta22 igesteuert 
wird, in das Verwaltungsverzeichnis RG geschrieben. 

2. Das Laden des Schieberegisters RDM und die 
Transferaktivierung w&hrend des Ubergangs von der Phase 

30 theta22 zur Phase theta23, 

3. Das Setzen der Kippschaltung B32 in den 
Logikzustand Bins, das den Phasenverteiler bei der Phase 
theta23 bis zum Ende des Transfers blockiert, das durch 
das Signal f in_t rans f er t_ma j aus der Logik TFR 

35 signalisiert wird, 

4. Das Freimachen des 
Verwaltungsverzeichnisses RG und des Cache- Speichers MC 
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durch Zurucksetzen der Kippschaltung B24 auf Null bei der 
Phase theta23. 

So wird der Zugriff auf das Verzeichnis frei 
gemacht (somit zuganglich fur den Spionprozessor PE) , der 
5 Update-Transfer ist im Gange und der Phasenverteiler auf 
theta23 blockiert. 

Sobald der Transfer beendet ist, wartet der 
Block im Schieberegister RDM und es muS der 
Verwaltungsprozessor des parallelen Drahts aktiviert 
10 werden, damit das Schreiben in den Hauptspeicher RAM 
effektiv ist. 

1 Dazu ist die Kippschaltung B33 durch ihren 

Ausgang Q tnit der Dienstabf rageleitung rqst_SP verbunden, 
die fiir den Verwaltungsprozessor des parallelen Drahts PGP 

15 bestimmt ist. Der Ausgang Q ist mit einetu der Eingange der 
Verknupfung OU23 verbunden, der Eingang S* mit der 
invertierten Phase theta24 des Phasenverteilers und der 
Eingang R tnit dem Signal ack_SP. Der Bus adr_X ist mit dera 
Bus adr_bloc_SP des Verwaltungsprozessors des parallelen 

20 Drahts PGP verbunden. Eine der Busleitungen adr_bloc_SP 
empfclngt das Signal ma j , urn die Abfrageart anzugeben: 
Update. 

Sobald der Phasenverteiler durch das Signal 
fin_transf ert_maj freigemacht . wird, bewirkt der 
.) 25 darauf folgende aktive Ubergang des allgemeinen Taktgebers 
h den Wechsel der Phase theta23 zur Phase theta24. Die 
Phase theta24 bewirkt eine Dienstabf rage beira 
Verwaltungsprozessor des parallelen Drahts PGP 
(Aktivienuig der Leitung rqst_SP) und das Blockieren des 

30 Phasenverteilers bis zum Quittieren der Abfrage durch das 
Signal ack SP. In dem Moment wird der Update - 
Schreibvorgang durch den Verwaltungsprozessor des 
parallelen Drahts PGP tatsSchlich durchgefiihrt worden 
sein. Der . Phasenverteiler wird dann bei dem nachsten 

35 aktiven llbergang des Taktgebers h von der Phase theta24 
zur Phase theta25 iibergehen. 

Das Update des Hauptspeichers RAM ist beendet: 
die Kippschaltung B20 wird durch Aktivierung ihres 
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Eingangs R durch die invertierte Phase theta25 auf Null 
gesetzt. Die Kippschaltung B21 wird durch Aktivierung 
ihres Eingangs s durch die Phase theta25, die durch das 
Signal maj mittels der Verkntipfung ET22 tlber die 
5 Verkniipfungen NOU22 bedingt ist, auf Eins gesetzt. Im 
Falle eines Inf ormationsmangels im Cache-Speicher , stellt 
das vollstandige Entladen eines Blocks nur den ersten Teil 
der Abfrage dar: die Anforderung rqstJffS ist dimmer noch 
vorhanden, jedoch ermoglicht das Freimachen der 

10 Kippschaltung B21 die Inbetrachtziehung eventueller 
Update-Anforderungen, die sich in der Warteschlage FIFO im 
Wartezustand befinden. Sobald die Warteschlange FIFO leer 
ist (empty » 0) , wiederholt sich der gesamte zuvor 
beschriebene Zyklus, dieses Mai mit dem Freigabebit auf 

15 Null. Man befindet sich dann in dem nachfolgenden Fall. 

2. Fall ; maj = 0. Dieser Fall kommt vor, wenn 
das Freigabebit auf Null ist (eventuell infolge eines 
vollstSndigen Entladens eines Blocks) oder wenn das 
Freigabebit auf Eins ist, das Modif ikationsbit jedoch auf 

20 Null: die aktualisierte Kopie dieses Blocks befindet sich 
bereits im Hauptspeicher RAM. 

So bewirkt die Dienstabfrage rqst_SR dafiir 
eine Zugriff serlaubnis zum Verwaltungsverzeichnis RG und 
zum cache-Speicher MC mit Lesen des Stichworts, 

25 Einspeichern der Bits m und v f Erzeugung des Signals maj, 
erneutes Schreiben des Stichworts mit v - 0 (maj befindet 
sich im Null-Zustand, die Kippschaltung B31 befindet sich 
im Null-Zustand und ihr Ausgang Q hat also den Wert Eins, 
was auf dem Eingang sel20 des Multiplexers MUX20 ein 

30 Logiksignal im Zustand Eins fordert und soxnit die 
Konstante 0 setzt) und das Freimachen des Zugangs zum 
Verwaltungsverzeichnis RG und zum Cache-Speicher MC. Diese 
Operationen werden wirksam, sobald die Phase theta23 
aktiviert worden ist. 

35 Der angeforderte Block muB nun im 

Hauptspeicher RAM gelesen werden. Dazu wird das 
invertierte Signal maj an einem der Eingange einer 
Verknupfung NET21 empfangen, die auf ihrem anderen Eingang 
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die Phase theta25 erapf &ngt . Der Ausgang der Verknupfung 
NBT21 ist mit den EingSngen "s der Kipp s chad tungen B34 und 
B35 verbunden. Die Kippschaltung B34 empfSLngt auf ihrem 
Bingang R das Signal f in_r§ception, das von der 
5 Transferlogik TFR kotnmt. Ihr Ausgang Q ist mit dem 
Differenzierer D21 verbunden- Dieser Differenzierer ist 
mit der Verknupfung OU22 verbunden. Der Eingang R der 
Kippschaltung B35 ist mit dem Signal grnt_SR und der 
Ausgang Q mit einem der Eing&nge der Verknupfung OU23 
10 verbunden. 

Das Lesen eines Blocks im Hauptspeicher RAM 
' und sein Transfer in den Cache-Speicher werden 
folgendermafien durchgefuhrt: der Ubergang der Phase 
theta23 zur Phase theta24 lost eine Dienstabfrage beim 

15 Verwaltungsprozessor des parallelen Drahts aus, und zwar 
durch Aktivierung der Leitung rqst_SP, die von der 
Kippschaltung B33 kommt. Die Art der Operation ist dieses 
Mai ein Lesevorgang <r_adr_X « 0) oder ein Schreibvorgang 
(w_adr__X = 0) und der Bus adr_X liefert auf dem Bus 

20 adr_bloc_SP die Adresse des angeforderten Blocks. Der 
Phasenverteiler ist bis zur Ankunft des Quittiersignals 
ack_SP blockiert: die Lese- oder Schreib-Anforderung ist 
durch den Verwaltungsprozessor des parallelen Drahts PGP 
an den Hauptspeicher RAM gemacht worden, und der Block ist 
) 25 durch diesen selben Prozessor zur gleichen Zeit 
f reigegeben ' und mit "im Wartezustand" gekennzeichnet 
worden. Der Transfer vom Hauptspeicher RAM zum 
Schieberegister RDP ist also im Gange, 

Der freigemachte Phasenverteiler liefert dann 

30 die Phase theta25. Diese Phase setzt mittels der 
Verknupfung NET21, die auf ihrem anderen Eingang das 
invertierte Signal maj etnpfangt, die Kippschal tungen B34 
und B35 in den Logikzustand Bins. Die Kippschaltung B35 
blockiert den Phasenverteiler. Die Kippschaltung B34 wird 

35 bei Ankunft des im Register RDP angeforderten Blocks, die 
durch die Aktivierung der Leitung f in_r€ception aus der 
Transferlogik TtfR signalisiert wird, auf Null 
zuruckgesetzt, was durch Aktivierung der Leitung rqst_SR 
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aus der Kippschaltung . B24 die Aktivierung des 
Differenzierers D21 und eine Zugrif fsanforderung auf das 
Verwaltungsverzeichnis RG und auf den Cache-Speicher MC 
bewirkt . 

5 Die Zugrif fserlaubnis, die durch die Leitung 

grnt_SR signalisiert wird, entblockt den Phasenverteiler 
durch Zunacksetzen der Kippschaltungen B25 und B35 auf 
Null und offnet den Zugang zura Verwaltungsverzeichnis RG 
und zum Cache-Speicher MC. Der Phasenverteiler liefert 

10 beira darauffolgenden aktiven Ubergang des allgemeinen 
Taktgebers h die Phase theta26. 

Die Kippschaltung B27, die mit dem Signal wJRG 
des Verwaltungsverzeichnisses verbunden ist, ist von 
theta26 bis theta27 aktiv, was die Durchfiahrung des 

15 Updates des Verwaltungsverzeichnisses ermoglicht, mit: 

- Feld tag des Busses data_RG = Feld tag des 
Busses adr_X, 

- Freigabebit v = 1 (maj » 0 und der Ausgang Q 
der Kippschaltung B31 ist auf Null: der Multiplexer MDX20 

20 l&£t v durch, das durch den Verwaltungsprozessor des 
parallelen Drahts PGP auf Eins gesetzt worden ist oder 
durch den Spionprozessor PE bereits auf Null zuruckgesetzt 
worden ist) , 

- Modifikationsbit m = Zustand der Leitung 
25 r_adr_X des Busses adr_X (Schreib-Anforderung bewirkt m = 

1, Lese-Anf orderung m « 0) , 

- Transfer- Wartebit a = 0, 

- Bit f = 0. 

Die Kippschaltung B31 aktiviert das Signal 
30 w_MC des Cache- Speichers MC von theta26 bis theta27, was 
das Schreiben des Inhalts des Schieberegisters RDM (die 
Puffer BV26 werden durch den Ausgang Q der Kippschaltung 
B31 und das invertierte Signal maj freigegeben) Ober die 
Preigabepuf f er BV22, die von der Kippschaltung B31 ftir die 
35 Trans f err ichtung gesteuert werden, an der richtigen Stelle 
(Feld -Rahmen- des Busses adr_X, verbunden mit dem Bus 
adr_MC) des Cache- Speichers erm6glicht. 
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Bei AnJcunft der Phase theta27, ist das Update 
des Verwaltungsverzeichnisses und des Cache -Speichers 
beeridet . Die AnJcunft der Phase theta27 bewirkt das 
Zurucksetzen der Kippschaltung B24 auf Null, was den 
5 Zugang zum Verwaltungsverzeichnis RG und zum Cache - 
Speicher MC freimacht, und die Aktivierung des Ausgangs 
der Verkniipfung ET23, was die Kippschaltung B21 auf Bins 
zurucksetzt und das Signal ackJJS fir den Abfrage- 
Verwaltungsprozessor PGU aktiviert: die Abfrage ist 
10 beendet • 

Im ubrigen hat der Spionprozessor PE die 
' Aufgabe der Aufrechterhaltung der Koh&renz der Daten im 
Cache- Speicher MC; als Beispiel ist in Abbildung 15 eine 
Architektur dieses Prozesslors dargestellt. Dieser wird bei 
15 jedem aktiven fibergang des Signals valid des gemeinsamen 
Busses BUSA ausgeldst. 

Wird das Signal valid durch einen anderen als 
den dem Spionprozessor PE zugeordneten 

Verwaltungsprozessor des parallel en Drahts PGP aktiviert, 
20 dann hat der Spionprozessor folgende Aufgabe, die abhangig 
von der Abfrageart ist: 

Lese-Abfrage eines Blocks von nicht 
geteilten Daten oder Schreib-Abfrage eines Block-Updates: 
keine, 

••25 - Schreib-Abfrage eines Blocks von geteilten 

Daten: 

. Block nicht vorhanden: keine, 

. Block vorhanden und nicht raodif iziert : 

keine, 

30 • Block vorhanden und modif iziert: 

Anforderung nach einem vollstandigen Entladen des Blocks 
(ob dieser Block vorhanden ist oder sich bei einem 
Transfer vom Hauptspeicher RAM zum Cache-Speicher MC 
befindet, der Zustand wird vom Bit -a- des Stichworts 

35 signalisiert) , 

- Schreib-Abfrage eines Blocks von geteilten 

Daten : 

. Block nicht vorhanden: keine, 
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• Block vorhanden und nicht modifiziert: 
Block ungultig machen, 

Block vorhanden und modif iziert: 
Anforderung nach vollstandigem Entladen des Blocks 
5 {dieselbe Anmerkung wie oben) , 

- Informations -Schreib-Abfrage eines Blocks: 
. Block nicht vorhanden: keine, 

Block vorhanden und nicht modif iziert: 
Block ungultig machen, 
10 . Block vorhanden und modif iziert: Fall ist 

unmdglich, 

. befindet sich eine Informations-Schreib- 
Anforderung auf demselben Block im Wartezustand, so wird 
sie in eine Block-Schreib-Abfrage umgewandelt , da dieser 

15 Block ungttltig gemacht worden ist; dazu wird die sich im 
Gang befindliche Abfrage annuliert und ein Quittieren an 
den Abfrage-Verwaltungsprozessor PGU zurilckgesandt . Dieser 
letztere konsultiert das Verzeichnis RG und findet dort 
den nicht vorhandenen Block: eine Abfrage wird an den 

20 Verwaltungsprozessor PGS gesandt. Diese Operation wird von 
dem parallelen Verwaltungsprozessor PGP in Betracht 
gezogen. 

Wird von dem dem Spionprozessor zugeordneten 
Verwaltungsprozessor des parallelen Drahts PGP das Signal 
25 valid aktiviert, dann hat der Spionprozessor folgende 
Aufgabe, die abh&ngig von der Abfrageart (der sogenannten 
lokalen Abfrage) ist: 

Lese-Abfrage eines Blocks von nicht 
geteilten Daten oder Schreib-Abfrage eines Block-Updates : 
30 keine, 

- Lese-Abfrage eines Blocks von geteilten 
Daten: den Block als gtiltig, im Transf erwartezustand und 
als nicht modifiziert (v » a » .1 und m a 0) kennzeichnen, 

- Schreib-Abfrage eines Blocks von geteilten 
35 Daten: den Block als gultig, im Transf erwartezustand und 

als modifiziert (v - m = a = 1) kennzeichnen, 

- Informations -Schreib-Abfrage eines Blocks: 
den Block mit "modifiziert" (m = 1) kennzeichnen. 
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Um fxir die Durchfilhrung der oben beschriebenen 
Funktionen zu sorgen, umfafit der Spionprozessor PE einen 
Phasenverteiler DP_E, der aus einem Schieberegister SR40 
und einer Kippschaltung B40 besteht. Der Ausgang eines 
5 Dif f erenzierers D40 ist mit dem Eingang "s der 
Kippschaltung B40 und dem Eingang clear 40 des Registers 
SR40 sowie mit dem Eingang ~S einer Kippschaltung B41 
verbunden. Der Ausgang Q der Kippschaltung B40 ist mit dem 
Eingang serial_in40 des Registers SR40 verbunden. Der 

10 Eingang clk40 des Registers SR40 etnpfangt das Signal h des 
allgemeinen Taktgebers und der Freigabeeingang en40 ist 
mit dem Ausgang Q der Kippschaltung B4 3 verbunden. Die 
invertierte Phase theta41 aus dem Register SR40 ist mit 
dem Eingang R der Kippschaltung B40 verbunden, 

15 Das Funktionieren des Phasenverteilers 

entspricht der im Abf rage-Verwaltungsprozessor PGU 
gemachten Beschreibung . 

Das Signal valid des Busses BUSA ist mit dem 
Eingang des Diff erenzierers D40 und dem Freigabeeingang 

20 en41 eines Decodierers DEC41 verbunden. Die Kippschaltung 
B41 empfSngt auf ihrem Eingang R den Ausgang der 
Verknupfung NOU40. Der Ausgang Q der Kippschaltung B4l # 
mit offenem Kollektor, ist mit dem Signal done des Busses 
BUSA verbunden. 

25 Die Signale valid und done sorgen fur die 

Synchronisation des Spionprozessors PE mit den anderen 
Spionprozessoren des Mehrprozessorsystems : der negative 
tibergang des Signals valid 16st den Dif f erenzierer D40 
aus, der einen Impuls erzeugt, der es ermoglicht, den 

30 Phasenverteiler zu aktivieren und das Signal done mittels 
der Kippschaltung B41 in den Null-Zustand zu setzen. Das 
Ende der Arbeit des Spions wird durch eine 
Zustands&nderung auf dem Ausgang der Verknupfung NOU40 
signalisiert , diese Zustands&nderung bewirkt mittels der 

35 Kippschaltung B41 das Setzen des Signals done in den 
Logikzustand Eins. 

Die Arbeit des Spions ist abh&ngig von der Art 
der Anforderung, und zu diesem Zweck wird das Feld Typ des 
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Busses BUSA an den Eingang des Decodierers DEC41 
angeschlossen. Die Ansgange dnp und dmaj des Decodierers 
DEC41 sind mit den Eingangen einer Verknupfung OU40 
verbunden. Die AusgSnge 61, de und dei des Decodierers 
5 DEC41 sind mit den Eingangen einer Verknupfung 0U41 
verbunden, wobei die Ausg&nge de und dei ebenfalls mit den 
Eingangen einer Verkmipfung 0U42 verbunden sind. Der 
Ausgang der Verknupfung OU40 ist mit einero der Eingange 
der Verknupfung NOU40 xnittels einer Verknupfung ET40 

10 verbunden, die auf ihrem anderen Eingang das Signal 
theta4l empfangt. Der Ausgang der Verknupfung OU41 ist mit 
einem der Eingange der Verknupfung ET42 beziehungsweise 
ET43 verbunden, die auf ihrem anderen Eingang das 
Phasensignal theta41 beziehungsweise theta44 empfangen. 

15 Die Ausgfinge der Verknupfungen. ET42 und ET43 sind mit dem 
Eingang S beziehungsweise R einer Kippschaltung B44 
verbunden. Der Ausgang der Verknupfung ET42 ist ebenfalls 
mit den Eingangen S der Kippschaltungen B42 und B43 
verbunden. Eine Verknupfung N0U41 empfangt auf ihren 

20 Eingangen das Phasensignal theta45 und den Ausgang einer 
Verknupfung ET45, die auf ihren beiden Eingangen die Phase 
theta44 und den invertierten Ausgang einer Verknupfung 
0U43 empfangt. Der Ausgang der Verknupfung N0U41 ist mit 
dem Eingang R der Kippschaltung B42 verbunden. Der Ausgang 

25 Q der Kippschaltung B42 ist mit dem Signal rqst_PR 
verbunden und das Signal grnt_PR wird an den Eingang R der 
Kippschaltung B43 ausgegeben, und zwar an . die 
Preigabeeingange der Ubergabepuf fer BV40 und an einen der 
Eingange der Verknupfung OU44. Die Verknupfung 0U44 

30 empfangt auf ihrem anderen Eingang den Ausgang Q einer 
Kippschaltung B45, und ihr Ausgang gibt die Ubergabepuf fer 
BV41 frei. Der Ausgang der Verkmipfung ET45 ist ebenfalls 
mit einem der Eingange der Verknupfung NOU40 verbunden, 
die auf einem anderen Eingang das Phasensignal. theta45 

35 empfangt. Der Ausgang der Verknupfung 0U42 ist mit den 
Eingangen von Verknupfungen ET46 und ET47 verbunden, die 
auf ihren Eingangen ebenfalls den Ausgang einer 
Verknupfung OU43 und die Phase theta44 beziehungsweise 
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theta45 enipfangen. Der Ausgang Q~ der Kippschaltung B44 
gibt das Signal r_RG ilber einen Puffer BV40 aus, der 
Ausgang Q der Kippschal tung B45 gibt flber einen Puffer 
BV40 das Signal w_RG aus. Das Feld Rahmen des gemeinsamen 
5 Busses BUSA ist uber einen Puffer BV40 mit dem Bus adr_RG 
verbunden. Der Bus data_RG ist mit den Ausgfingen der 
Freigabepuffer BV41 und mit dem Eingang des Registers 
REG40 verbunden, das auf seinem Eingang load40 das 
Phasensignal theta43 empfangt. Der Ausgang des Registers 

10 REG40 1st, was den Teil tag betrifft, mit den EingSngen 
der Puffer BV41 und mit einem der Eing&nge eines 
Koraparators COMP40 verbunden. Der Romparator COMP40 
empfangt auf seinem anderen Eingang den Teil tag des 
Busses BUSA. Das Freigabebit v aus dem Register REG40, das 

15 an den Kotnparator COMP40 angeschlossen ist, hat ihm 
gegeniiber den konstanten Wert 1. Die Bits v, a, m und f am 
Ausgang des Registers REG40 sind mit einem der Eingange 
der Multiplexer MUX40, MUX41, MDX42 beziehungsweise MDX43 
verbunden. Die Ausg&nge dieser Multiplexer lief era den 

20 Zustand dieser selben Bits an den Eingang der Puffer BV41. 
Der Multiplexer MDX40 empfangt auf seinen anderen 
Eingingen die Konstanten Null und Eins, die Eingange sel40 
sind mit dem Ausgang einer Verknupfung ET48 und mit einem 
Signal dlle verbunden. Der Multiplexer MUX41 empfangt auf 
1 25 seinem anderen Eingang die Konstante Eins, die ausgew&hlt 
wird, wenn sich sein Eingang sel41, der ein Signal dlle 
aus dem Verwaltungsprozessor PGP empfangt, im Logikzustand 
Eins befindet. Der Multiplexer MUX42 enqpfangt auf seinen 
anderen EingSngen die Konstante Bins und das Signal 

30 r_adrbloc_SR, seine Eingange sel42 enipfangen die Signale 
dlei und dlle aus dem Verwaltungsprozessor PGP. Der 
Multiplexer MUX43 empfangt auf se.inem anderen Eingang die 
Konstante Eins, die ausgewSLhlt wird, wenn sich sein 
Eingang sel43, der mit dem Ausgang einer Verkntipf urig ET49 

35 verbunden ist, im Logikzustand Eins befindet. Die 
Verknupfung ET49 empfangt auf ihren Eingangen den Ausgang 
eg40 des Komparators COMP40, das invertierte Signal f und 
das Signal m. Die Verknupfung ET48 empfangt auf ihren 
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Eingangen den Ausgang eg40, das invertierte Signal tn ( das 
Signal dlei und den Ausgang der Verknupfung OU42. Die 
VerknUpfung OU43 etnpfangt auf einetn ihrer Eing&nge das 
Signal eg40 und auf ihrem anderen Eingang das Signed dlle. 
5 Der Ausgang der Verknxipfung ET49 ist ebenfalls mit detn 
Eingang load41 der Warteschlange FIFO verbunden, die 
bereits in dem Verwaltungsprozessor des Seriendrahts PGS 
beschrieben ist. Die Felder Rahmen und tag des Busses BUSA 
sind mit dem Eingang der Warteschlange FIFO verbunden. Die 

10 Signale dlei, dlle und r_adrbloc_SP kotnmen vom 
Verwaltungsprozessor des parallellen Drahts PGP, der im 
ubrigen das Signal dei des Decodierers DEC41 empf&ngt. 

Das Ganze funktioniert folgendermafien: die 
Aktivierung des Signals valid initialisiert den 

15 Phasenverteiler DP_E und gibt den Decodierer DEC41 frei, 
der die Aktivierung eines Ausgangs bewirkt, und zwar 
abh&ngig von der Information "Typ", die die Art der sich 
im Gang befindlichen Anforderung an den gemeinsamen Bus 
BUSA codiert. Der aktive Ausgang kann sein: 

20 - dnp: Lese-Abfrage von nicht geteilten Da ten. 

Das Signal done wird bei Erscheinen der Phase theta41 
inaktiviert; 

- dmaj: Schreib-Abfrage fur ein Block-Update. 
Das Signal done wird bei der Phase theta41 inaktiviert; 

,' 25 - dl: Block-Lese-Abfrage; 

- de: Block- Schreib-Abfrage; 

- dei: Informations -Schreib-Abfrage. 

Diese drei Falle benotigen einen Lese-Zugriff 
auf das Verzeichnis RG, und die beiden letzteren ein 

30 eventuelles emeutes Schreiben des Verzeichnisses . Dazu 
wird von der Kippschaltung B42 (Signal rqst_PR) eine 
Zugrif fs-Abfrage auf den Verzeichnis -Verwaltungsprozessor 
PGR gesandt, wobei die Kippschaltung B43 den 
Phasenverteiler bis zur Zugrif fsserlaubnis unterdrtickt, 

35 die durch das Signal grnt_PR gegeben wird. Das Lesen 
erfolgt somit von theta41 bis theta44 (Kippschaltung B44) 
und das eventuelie Schreiben von theta44 bis theta45 
(Kippschaltung B45) mit Einspeichern des Stichworts 
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wahrend der Phase theta43 in das Register RBG40. 1st der 
Block im Cache-Speicher MC nicht vorhanden (eg40 a 0), 
dann wird bei der Phase theta44 das Signal done 
inaktiviert, 1st der Block im Cache-Speicher vorhanden 
S (eg40 = l) , dann: 

- ist m = 1, wird eine Anforderung nach 
vollstandiger Entladung aktiviert (Aktivierung der 
Verknupfung ET49) , und zwar unter der Bedingung, da£ sich 
dieser Block nicht schon in der Warteschlange (f = 0) 

10 befindet: das einzige modifizierte Bit ist f , das wahrend 
des erneuten Schreibens des Stichworts auf Bins gesetzt 
wird, 

- ist m o 0, wird der Block durch den 
Multiplexer MUX40 (Aktivierung der Verknupfung ET48) 

IS ungultig geraacht, 

- ist die Anforderung lokal (dlle Oder diei 

aktiv) dann: 

1) werden beim Lesen Oder Schreiben die 
Bits v und a auf 1 und m auf 0 (Lesen) Oder auf 1 

20 (Schreiben) (Zustand des Signals r_adrbloc_SP) gesetzt, 

2) wird beim Informations -Schreibvorgang 
das Bit m auf 1 gesetzt. 

In diesen letzteren Fallen, die ein 
Neuschreiben in das Verwaltungsverzeichnis RG erfordern, 

25 wird das Signal done bei der Phase theta45 inaktiviert. 

Der Verwaltungsprozessor des parallelen Drahts 
PGP, von dera ein Beispiel in Abbildung 16 dargestellt ist, 
hat die Aufgabe, den gemeinsamen Bus BUSA abzufragen \ind 
die angeforderte Transaktion durchzufiihren, entweder durch 

30 den Abf rage-Verwalt\xngsprozessor PGU oder durch den 
Verwaltungsprozessor der Serienverbindung PGS. 

Bei einer Anforderung aus dem Abfrage- 
Verwaltungsprozessor PGU kann es sich nur urn eine 
Informations -Schreib-Abf rage handeln. Eine Anforderung aus 

35 dem Verwaltungsprozessor der Serienverbindung PGS ist 
entweder eine Block-Lese- Oder Block-Schreib-Anf orderung 
Oder aber eine Block-Update-Anf orderung. 
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Der Verwaltungsprozessor des parallelen Drahts 
PGP umf afit eine Kippschaltung B60, die durch ihren 
Dateneingang D mit dem Signal rqst_UP verbunden 1st. Eine 
Kippschaltung B61 ist durch ihren Dateneingang D mit dem 
5 Signal rgst_SP verbunden. Die AusgSnge Q und "q einer 
Kippschaltung B62 sind mit dem Taktgebereingang der 
Kippschaltung B60 beziehungsweise B61 verbunden. Der 
Ausgang Q der Kippschaltung B62 ist auf deren Dateneingang 
zur Schleife geschaltet. Die Ausgange ~Q der 

.10 Kippschaltungen B60 und B61 sind mit den Eingangen einer 
Verknupfung OU60 verbunden. Der Ausgang der Verknupfung 
OU60 ist einerseits mit einem Dif f erenzierer D60 verbunden 
und andererseits, und zwar invert iert, mit einem Eingang 
einer Verknupfung ET60, die auf ihrem anderen Eingang das 

15 Signal des allgeraeinen Taktgebers h erapfangt. Der Ausgang 
der Verknupfung ET60 ist mit dem Taktgebereingang der 
Kippschaltung B62 verbunden. Der Ausgang des 
Diff erenzierer s D60 ist mit dem Eingang S" einer 
kippschaltung B63 verbunden. Der Ausgang Q der 

20 Kippschaltung B63 gibt ein Signal rqsti zum Arbiter AB 
aus, und ihr Eingang *R ist mit dem Ausgang einer 
Verknupfung ET62 verbunden. Das aus dem Arbiter AB 
stammende Signal grnti ist rait den Verknupfungen OU62 und 
NOO60 verbunden. Die Verknupfung OU62 etnpfangt auf ihrem 

25 anderen Eingang das invertierte Signal valid, und ihr 
Ausgang ist mit dem Eingang eines Dif f erenzierers D61 
verbunden. Der Ausgang dieses Dif f erenzierers D61 ist mit 
einem der Eingange der Verknupfung ET62 und dem Eingang "s 
einer Kippschaltung B€4 verbunden. Der Ausgang Q dieser 

30 Kippschaltung B64 ist mit dem Preigabeeingang von 
Ubergabepuf fern BV60 und nach Negation mittels eines 
Inverters mit offenem Kollektor 160 mit dem Signal valid 
verbunden. Das Signal done ist mit dem Eingang eines 
Diff erenzierers D62 verbunden. Der Ausgang dieses 

35 Diff erenzierers D62 ist mit dem Eingang "r der 
Kippschaltung B64 und mit einem der Eingange der 
Verknupfung NOU60 verbunden. Der Ausgang dieser 
Verknupfung NOU60 ist mit einem der Eingange von 
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Verknfcpfungen NET60 und NET61 verbunden, die auf ihrem 
anderen Eingang den Ausgang Q" der Kippschaltung B60 
beziehungsweise B61 erapfangen. Die Ausgange *Q der 
Kippschaltungen B60 und B61 sind ebenfalls mit den 
5 Freigabeeingangen des fibergabepuf fers BV61 beziehungsweise 
BV62 verbunden. Der Ausgang der Verknupfung NET60 ist 
einerseits mit dem Eingang IT der Kippschaltung B60 
verbunden, andererseits mit einem der EingSnge einer 
Verknupfung ET63, die auf ihrem anderen Eingang den 

10 Ausgang eines Dif ferenzierers D63 empfangt. Der Ausgang 
der Verknupfung ET63 gibt das Signal acq_UP zura 
Verwaltungsprozessor PGU aus. Der Ausgang der Verkniipfung 
NET61 ist mit dem Eingang s" der Kippschaltung B61 
verbunden und liefert das Signal ack_SP. Der Bus 

15 adr_bloc_UP ist mit dem Eingang der Freigabepuf fer BV61 
und mit einem der Eingange eines Komparators COMP60 
verbunden. 

Der Bus adr_bloc_SP ist mit dem Eingang der 
Freigabepuf fer BV62 verbunden. Die Puf ferausgange BV61 und 

20 BV62 sind miteinander und mit dem Eingang der 
Freigabepuf fer BV60 verbunden. Der Ausgang der Puffer BV60 
ist mit dem gemeinsamen Bus BUSA verbunden. Die 
Verknupfungen OU63 und OU64 erapfangen auf ihren Eing&ngen 
den Ausgang (T der Kippschaltung B60 beziehungsweise B61, 

25 das Logiksignal grnti und das Signal maj fur OU64. Der 
Ausgang der Verkniipfung OU63 gibt das Signal dlei aus, und 
der Ausgang der Verknupfung 0U64 das Signal dlle. Der 
andere Eingang des Komparators COMP60 enrpf&ngt die Felder 
tag und Rahmen des gemeinsamen Busses BUSA. Der Eingang 

30 en60 des Komparators COMP60 ist mit dem Ausgang der 
Verknupfung ET61 verbunden, die auf ihren Eingangen das 
invert ierte Signal grnti, das Signal dei und das 
invertierte Signal rqst_UP empfangt. Der Ausgang eg60 des 
Komparators COMP60 ist mit dem Eingang des Dif ferenzierers 

35 D63 verbunden. Der Ausgang dieses Dif ferenzierers ist 
ebenfalls mit den Eingangen R der Kippschaltungen B60 und 
B6l und mit dem anderen Eingang der Verknupfung ET62 
verbunden . 
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Das Ganze funktioniert folgendermafien: 
Die den Verknupfungen ETSO und OU60 
zugeordneten Kippschaltungen B60, B61 und B62 bilden einen 
lokalen Arbiter. Dieser Arbiter untersucht abwechselnd die 
5 Abfragen rqst_UP und rqst_SP und leitet sie durcb das 
Signal rqsti 2um Arbiter AB des gemeinsamen Busses BUSA 
weiter. Die Zugrif f serlaubnis wird durch die Freigabe des 
Signals grnti gegeben und der Buszyklus ISuft ab, sobald 
das Signal valid, das den Arbiter AB freimacht, 
10 inaktiviert worden ist. Die Aktivierung des Signals done 
tnacht den lokalen Arbiter frei: die Transaktion ist 
beendet . 

Kommt die Abfrage vom Verwaltungsprozessor der 
Serienverbindung. PGS, dann zeigen die Signale dlei und 

15 dlle dem zugeordneten Spionprozessor PE die Art des 
Updates der Blockzustandsbits an, das in dem Verzeichnis 
RG durchzufuhren ist, 

Kommt die Abfrage vom Abfrage- 
Verwaltungsprozessor PGU her, dann findet bei Entdecken 

20 eines Inf ormations-Schreibvorgangs auf demselben Block 
(Signal dei aus dem Spionprozessor PE) , ein sof ortiges 
Preitnachen statt: der Abfrage-Verwaltungsprozessor PGU 
leitet nach Konsultation des Verzeichnis ses (der Block ist 
ungaltig gemacht worden) seine Anforderung zum 

25 Verwaltungsprozessor der Serienverbindung PGS . 

Der Speicher-Verwaltungsprozessor PGM, von dem 
ein Beispiel in Abbildung 17 dargestellt ist, hat die 
Aufgabe, ftlr das Lesen und Schreiben eines Blocks im 
Hauptspeicher RAM zu sorgen und an der Aufrechterhaltung 

30 der Koharenz der Information in den verschiedenen Cache- 
Speichern MC des Mehrprozessorsystems teilzunehmen. 

Zu diesem Zweck umfaSt er einen Dif f erenzierer 
D80, der auf seinem Eingang ein Signal valid empfangt und 
dessen Ausgang mit den Eingangen S von Kippschaltungen B80 

35 und B81 sowie mit dem Eingang cTFT6 eines 
Schieberegisters SR80 verbunden ist. Auf dem Ausgang *Q der 
Kippschaltung B80/mit offenem Kollektor, wird das Signal 
done ausgegeben. Der Ausgang Q der Kippschaltung B81 ist 
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mit dem Eingang serial_in80 des Registers SR80 verbunden; 
diese Kippschaltung B81 ist durch ihren Eingang R an den 
invertierten Ausgang thetaei des Registers SR80 verbunden. 
Das Register SR80 etqpfangt auf seinem Eingang cl3c80 das 
5 Signal des allgemeinen Taktgebers h, und sein 
Ereigabeeingang en80 ist immer aktiv* Die Kippschaltung 
B81 und das Schieberegister SR80 bilden einen 
Phasenverteiler DP_M. Das Signal valid wird ebenfalls an 
den Freigabeeingang en81 eines Decodierers DEC80 

10 ausgegeben. Dieser Decodierer ist durch seinen 
Dateneingang mit dem Teil "Typ" des gemeinsamen Busses 
BUSA verbunden und liefert die Signale dnp, dl, de, ei und 
ma j . Ein Schreib-Lese-Speicher RAMFG mit einer Breite von 
2 Bits (ro beziehungsweise rw genannt) empfangt auf seinem 

15 Adre£bus die Felder tag und Rahmen des gemeinsamen Busses 
BUSA. Der Datenbus dieses Speichers, aus den Bits ro und 
rw gebildet, ist einerseits mit einer Logik PAL80 
verbunden, andererseits mit einer Verknupfung ET80, und 
2war direkt ftir rw und invert iert fur ro. Die Logik PAL80 

20 ist mit dem Feld Typ verbunden und empfangt die 
Logiksignale cl, r/w, s/n, mff und en82: das Signal cl 
koramt aus einer Kippschaltung B82, die Signale r/w und s/n 
aus einer assoziativen Warteschlange AFIFO, das Signal mff 
aus einer Verknfipfung ET81 und das Signal en82 aus einer 

25 Kippschaltung B83, die auf ihren Eingangen S" und "r 
invertierte Signale theta82 beziehungsweise theta81 aus 
dem Phasenverteiler DP_M empf&ngt. Die Logik PAL 
verdrahtet auf ihren Ausgangen ro - rw die f olgenden 
logischen Gleichungen: dnp a 10; dl.mff = 10; dl.mff ■■ 01/ 

30 de « 01; maj.cl = 00; ei = 01; maj .cl. s/n. r/w = 10/ 
maj .cl.s/n.rTw = 01. Der Ausgang der Verknupfung ET80 ist 
mit dem Eingang D einer Kippschaltung B84 verbunden, die 
auf ihrem Taktgebereingang die Phase theta82 empfangt. Der 
Ausgang Q dieser Kippschaltung ist mit einem der Eingange 

35 der Verknupfung ET81 verbunden, die auf ihrem anderen 
* Eingang den Ausgang der Verknupfung OU80 empfangt. Die 
beiden Eingange dieser VerknOpfung OU80 sind mit den 
Ausgangen de und dl des Decodierers DEC80 verbunden. Der 
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Leseeingang r des Speichers RAMFG 1st mit der Phase 
theta81 und der Schreibeingang w mit dem Ausgang einer 
Verknupfung ET82 verbunden. Die Verknupfung ET82 etnpfangt 
auf ihren Eingingen das Signal theta83 und den Ausgang 
5 einer Verknupfung ET83, deren Eingange mit dem Signal s/n 
und der Phase theta87 verbunden sind. Der Ausgang dnp des 
Decodierers DEC80 ist mit den Verknupfungen ET84 und ET85 
verbunden, die auf ihrem anderen Eingang die Phase theta81 
beziehungsweise theta85 empfangen. Das Signal s/n wird 

10 ebenfalls an Verkniipfungen ET86 und ET87 ausgegeben, die 
auf ihrem anderen Eingang die Phase theta86 
beziehungsweise theta90 empfangen. Der Ausgang mff der 
Verkntipfung ET81 ist ebenfalls mit einer Verknidpfung ET88 
verbunden, die auf ihrem anderen Eingang die Phase theta83 

15 etnpfangt, und nach Negation mit Verknupfungen ET89 und 
ET90 verbunden, die auf ihrem anderen Eingang die Phase 
theta83 beziehungsweise theta87 empfangen. Der Ausgang der 
Verknupfung ET88 ist mit dem Eingang wf f der Warteschlange 
AFIFO verbunden. Die Ausgange der Verkniipfungen ET84, ET86 

20 und ET89 sind mit den Eingangen einer Verknupfung OU81 
verbunden, deren Ausgang mit dem Eingang S einer 
Kippschaltung B85 verbunden ist. Die Ausgange der 
Verknupfungen ET85, ET87 und ET90 sind mit den Eingangen 
einer Verknupfung OU82 verbunden, deren Ausgang mit dem 

25 Eingang R der Kippschaltung B85 verbunden ist. Das Signal 
s/n ist ebenfalls, invertiert, mit einer Verknupfung ET91 
verbunden, die auf ihrem anderen Eingang die Phase . theta89 
erapfangt. Der Ausgang der Verknupfung ET91 ist mit dem 
Eingang einer Verknupfung NOU80 verbunden, die auf ihrem 

30 anderen Eingang den Ausgang der Verknupfung OU82 etnpfangt. 
Der Ausgang der Verknupfung NOU80 ist mit dem Eingang R 
der Kippschaltung B80 verbunden. Der Ausgang maj des 
Decodierers DEC 80 ist mit dem Eingang von Verknupfungen 
ET92, ET93, ET94 und ET95 verbunden, die auf ihrem anderen 

35 Eingang die Phase theta8l, theta85, theta85 
beziehungsweise theta91 empfangen. Die invertierten 
Ausgange der Verknupfungen ET92 und ET93 sind mit dem 
Eingang S beziehungsweise R einer Kippschaltung B86 
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verbunden und die der Verknupfungen ET94 und ET95 mit den 
Eingangen S und R einer Kippschaltung B82. Der Ausgang Q 
der Kippschaltung B82 erzeugt das Logiksignal cl # das 
ebenfallB an den Eingang cff der Warteschlange AFIFO und 
5 an den Steuereingang sel80 eines Multiplexers MUX80 
ausgegeben wird. Der Teil tag! Rahmen des gemeinsamen 
Busses BUSA ist mit dem Dateneingang der Warteschlange 
AFIFO und mit einem der Dateneingange des Multiplexers 
MDX80 verbunden. Der Ausgang dl des Decodierers DEC80 ist 

10 ebenfalls mit einem der Dateneingange der Warteschlange 
AFIFO verbunden, urn das Lese-/Schreib-Signal 1/e zu 
erzeugen. Der Datenausgang der Warteschlange AFIFO ist mit 
dem anderen Eingang des Multiplexers MUX80 verbunden. Der 
Ausgang des Mulitplexers MDX80 ist # was den Teil 

15 "tag. Rahmen 11 betrifft, mit dem Adrefibus des Hauptspeichers 
RAM verbunden und, was den Teil "Feld cpu" betrifft, mit 
den Eingangen von Decodierern DEC81 und DEC82 . Der Ausgang 
Q der Kippschaltung B86 ist mit dem Schreibeingang des 
Hauptspeichers RAM und dem Eingang en84 des Decodierers 

20 DEC82 verbunden. Der Ausgang Q der Kippschaltung B85, 
leicht verzogert, ist mit dem Leseeingang des 
Hauptspeichers RAM und mit einem der Eing&nge einer 
Verknupfung ET96 verbunden, die auf ihrem anderen Eingang 
den Ausgang der VerknQpfung OU82 empf&ngt. Der Ausgang der 

25 Verknupfung ET9 6 ist mit dem Eingang en83 des Decodierers 
DEC81 verbunden, Der Ausgang j des Decodierers DEC81 ist 
mit dem Freigabeeingang der Ubergabepuffer des Speicher- 
Schieberegisters RDMj verbxmden imd der Ausgang j des 
Decodierers DEC82 mit dem Ladeeingang des besagten 

30 Speicher- Schieberegisters RDMj. 

Das Ganze funktioniert folgendermafien: 
Die Aktivierung des Signals valid bewirkt die 
Auslosung des Phasenverteilers DP_M und die Freigabe des 
Decodierers DEC80, die es ermoglichen wird, die Art der 

35 Abfrage zu bestimmen. Die Phase theta81 wird benutzt, um 
den Zustand der Bits, die dem angef orderten Block 
entsprechen, im Speicher RAMFG zu lesen, und die 
Kombination ro.rw wird in der Kippschaltung B84 
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gespeichert* Bin erster Schreibvorgang findet in dem 
Speicher RAMFG bei der Phase theta83 statt, was es 
ermoglicht, die Zustandsbits zu aktualisieren. Ihr Wert 
wird von der Logik PAL80 geliefert und ermSglicht es, 
5 folgende Verkettungen zu erhalten: 

- bei einer Block-Abf rage von nichtgeteilten 
Daten (dnp) , unabh&ngig vom Zustand der Bits ro.rw (rw ist 
zwangsweise auf Null), wird der Zustand 10 gesetzt ("Block 
fur das Lesen ausgesandt") ; 

10 - bei einer Block-Lese-Abf rage (dl) oder 

Block-Schreib-Abfrage (de) wird f wenn ro.rw « 01 ist, die 
Abfrage bei der Phase theta83 in die Warteschlange 
gestellt und der Zustand auf 01 gesetzt (dies ist in der 
Tat der zuvor beschriebene Zustand) , ansonsten wird im 

15 Palle eines Lesevorgangs der Zustand auf 10 gesetzt 
("Block zum Lesen ausgesandt") und im Fall des 
Schreibvorgangs der Zustand auf 01 gesetzt ("Block zum 
Schreiben ausgesandt") ; 

- im Falle einer Update -Abf rage (maj ) , wird 
20 der Zustand auf 00 gesetzt ("Block nicht ausgesandt") „ In 

diesen verschiedenen Fallen wird das Lesen oder das 
Schreiben in den Hauptspeicher RAM zum oder vom Speicher- 
Schieberegister RDMj vorgenommen, das durch das Feld "cpu" 
des gemeinsamen Busses BUSA identif iziert worden ist. In 

25 dem ausgewShlten Beispiel betragt die Zyklusdauer des 
Speichers RAM 4 Perioden des allgemeinen Taktgebers h. 
Beim Lesen nicht geteilter Daten, lauft der Zyklus von 
theta81 bis theta85 ab, in den anderen Fallen von theta83 
bis theta87. Das Schreiben erfolgt von theta81 bis 

30 theta85? 

- beim Informations -Schreibvorgang, bewirkt 
dieses keine Datenbewegung, die Zustandsbits werden jedoch 
auf den Wert 01 gesetzt (der Ausgangszustand ist in diesem 
Fall zwangslaufig 10) ; 

35 - bei einer Update-Anforderung, wird 

systematisch eine Konsultation der Warteschlange AFIFO 
durchgef uhrt . Diese Konsultation kann das Lesen eines 
Blocks bewirken, und zwar dann, wenn sich eine 
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Zentraleinheit CPU fur ein Update dieses Blocks in der 
Warteschlange APIFO befindet. 

Das Lesen erfolgt von theta86 bis theta90 und 
der Zustand der Bits wird auf 10 gesetzt (Lese- 
5 Anforderung) Oder auf 01 (Schreib-Anforderung) . Jede 
Operation wird durch das Zurucksetzen der Kippschaltung 
B80 auf Null beeendet, die das Signal done aktiviert. 
Diese Inaktivierung kann bei der Phase theta85, tbeta87 
oder theta91 erfolgen, je nach der angeforderten 

10 Operation, oder bei theta89 r falls die Konsultation der 
Warteschlange ein negatives Ergebnis bringt. 

Die assoziative Warteschlange ist nicht im 
Detail beschrieben. Sie besteht nach herkdmmlicher Art und 
Weise aus einem assoziativen Speicher, der als 

15 Warteschlange benutzt wird. Die Anzahl der W6rter dieses 
Speichers ist gleich der Anzahl der Zentraleinheiten CPU 
des Mehrprozessorsystems . Ein interner "daisy- chain" 
identifiziert auf jeder Phase theta8l das nachste zum 
Schreiben bestimmte Wort, was gegebenenfalls bei der Phase 

20 theta83 durch das Signal wff erfolgt. Das Signal cff lost 
ab der Phase theta85 einen Vergleich aus, nachdem die 
Kippschaltungen des antwortenden Speichers bei der Phase 
theta84 auf Null zurilckgesetzt worden sind. Das Ergebnis 
des Vergleichs wird an das Signal s/n (some/none) 
} 25 weitergegeben, und der Inhalt des betreffenden Worts ist 
auf dera Datenausgang ab der Phase theta86 veirfugbar. 
Dieses Wort wird dann bei der Phase theta90 \ingilltig 
gemacht . 

In der oben beschriebenen Architektur werden 
30 die Spionprozessoren PEj bei jedem Adressentransfer auf 
dem gemeinsamen Bus BUSA beansprucht, mit eventueller 
Konsultation ihres Cache -Speichers MCj. Diese Konsultation 
ist in den meisten Fallen iiberflussig (geringe 
Wahrscheinlichkeit des Vorhandenseins der dem Transfer 
35 entsprechenden Blockadresse in den Cache-Speichern) . 

Es mu£ angemerkt werden, dafc der. Speicher- 
Verwaltungsprozessor PGM Zustandsbits der Blocke 
auf rechterhalt uad eine zentralisierte Verwaltung der 
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Aufrechterhaltung der Koharenz mdglich macht. Zu diesem 
Zweck kann zu der oben beschriebenen Architektur 
(Abbildung 10) ein paralleler Synchronisationsbus 
hinzugeftigt werden, der nach demselben Algorithms 
5 funktioniert, wie der Synchronisationsbus SYNCHRO der 
nachstehend beschriebenen Variante. Die Spionprozessoren 
sind genau genommen nun keine Spione mehr (da sie an den 
Synchronisationsbus und nicht an den gemeinsamen Bus BUSA 
angeschlossen sind) und werden als Prozessoren zur 

10 Aufrechterhaltung der Koharenz (PMCj bei der Variante der 
Abbildung 18) bezeichnet. So bleibt der Speicher- 
Verwaltungsprozessor PGM bei jedem Transfer auf dem 
gemeinsamen Bus BUSA beansprucht, jedoch werden die 
Prozessoren zur Aufrechterhaltung der Koharenz von dem 

15 Prozessor PGM nur beansprucht, wenn sie von dem Transfer 
betroffen sind* 

Abbildung 18 stellt eine Variante dar # in der 
die Koharenz nach dem oben beschriebenen Prinzip 
auf rechterhalten wird. Diese Variante nimmt die allgemeine 

20 Architektur der Abbildung 6 wieder auf, mit Blockadressen, 
die mitt els der Serienverbindungen LSj ubertragen werden. 
Dieses System umfaSt einen parallelen Synchronisationsbus 
SYNCHRO, der dieselbe logische Struktur aufweist, wie der 
gemeinsame Bus BUSA, der jedoch allein vom Speicher- 
- 25 Verwaltungsprozessor PGM gesteuert wird. 

Die Struktur der Zentraleinheit UCj entspricht 
der in Abbildung 10 dargestellten, mit einigen Anderungen: 
- die Struktur des Cache -Speichers MCj sowie 
die Struktur des Verwaltungsverzeichnisses RGj bleibt 

30 dieselbe, 

der parallele Verwaltungsprozessor PGPj 
verschwindet, da es keinen gemeinsamen Bus BUSA mehr gibt, 
und die Punktionen, die ihm zugeordnet waren, werden dem 
Verwaltungsprozessor der Serienverbindung PGSj zugeordnet; . 
35 - der Spionprozessor PEj wird durch einen 

Prozessor zur Aufrechterhaltung der Koharenz PMCj ersetzt, 
der mit der Aufrechterhaltung der Zustandsbits der Bldcke 
in dem Cache- Speicher MCj befafit ist, urn fur die Koharenz 



79 

zu sorgen, und der allein vom Speicher- 
Verwaltungsprozessor PGMj uber den Synchronisationsbua 
SYNCHRO aktiviert wird; 

- der Abfrage-Verwaltungsprozessor PGU hat nur 
5 noch einen einzigen Partner: den Verwaltungsprozessor der 

Serienverbindung PGSj, zu dem er alle seine Abfragen 
leitet; 

der Verwaltungsprozessor der 

Serienverbindung PGSj hat die Aufgabe, fur den Adressen- 
10 und Datentransfer zu sorgen, entsprechend detn System, 
dessen Prinzip bezuglich der Abbildung 6 beschriebenen 
ist, wobei jede Adresse durch die Art der Abfrage ein 
Prefix erhait; 

die Funktionalit&ten des Speicher- 
15 Verwaltungsprozessors PGM sind jene, die beztiglich 
Abbildung 17 beschrieben sind, seine Aktivierung erfolgt 
nicht mehr durch das Signal valid, das verschwindet (da es 
zuvor dem gemeinsamen Bus BUSA zugeordnet war) , sondera 
durch den Arbiter ABM, der in dem System der Abbildung 6 
20 beschrieben ist und der die Dienstanforderungen, die durch 
die Serienverbindungen ubertragen werden, parallel -seriell 
umsetzt. Der Speicher RAMFG besteht ebenfalls aus einem 
zusatzlichen Feld cpu, das den Zustandsbits ro.rw 
zugeordnet ist. 

25 Das in Abbildung 18 dargestellte 

Durchfuhrungsbeispiel funktioniert wie folgt: 

Jede Abfrage des Verarbeitungsprozessors CPU 
aktiviert den Abfrage-Verwaltungsprozessor PGUj mit der 
Angabe Lesen oder Schreiben und Code Oder Daten. Dieser 

30 Prozessor fordert bei dem Verzeichnis-Verwaltungsprozessor 
PGRj einen Zugriff zum Verwaltungsverzeichnis RGj an. Die 
Konsultation des Verzeichnisses fuhrt zu einem der 
folgenden F&lle: 

- der Block ist im Cache- Speicher MCj im 
35 "nicht modif iziert"-Zustand (m = 0) vorhanden? ist die 

Anforderung eine Lese-Anforderung, dann wird die 
angeforderte information aus dem Cache -Speicher MCj geholt 
und dem verarbeitungs -Prozessor CPUj geliefert. Ist die 
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Anforderung eine Schreib- Anforderung, dann wird eine 
Informations-Schreib-Abfrage ei an den 

Verwaltungsprozessor der Serienverbindung PGSj gesandt; 

- der Block 1st im Cache -Speicher MCj im 
5 "modifiziert" -Zustand (m = 1) vorhanden; der Anforderung, 

Lesen Oder Schreiben, wird entsprochen; 

- der Block ist im Cache- Speicher MCj nicht 
vorhanden; eine Blockabfrage Lesen Oder Schreiben wird an 
den Verwaltungsprozessor der Serienverbindung PGSj 

10 ubertragen. 

So konnen die an den Verwaltungsprozessor der 
Serienverbindung gestellten Abfragen sein: eine Lese- 
Anforderung nicht geteilter Daten (Code) : dnp, eine Lese- 
Anforderung des Blocks: dl r eine Lese -Anforderung des 

15. Blocks, urn dort zu schreiben: de, eine Informations- 
Schreib-Anf orderung : ei . 

Zu diesen verschiedenen Zustanden mufi der 
Update -Zustand maj, der dem vollstandigen Entladen eines 
Blocks entspricht, hinzugefugt werden, entweder auf 

20 Anforderung des Prozessors zur Aufrechterhaltung der 
Koharenz PMCj Oder urn eine Blockstelle im Cache -Speicher 
freizumachen. Die so mit einero Prafix versehenen Adressen 
werden \lber die Serienverbindungen LSj ubertragen und 
beanspruchen, getnafi dem bei der Beschreibung der 
.'25 Architektur der Abbildung 6 angesprochenen Prinzip, den 
Arbiter ABM, wenn: 

- bei einem Block-Lesen die Adresse ubertragen 

wird, 

- bei einera Block-Schreiben die Adresse und 
30 die Daten ubertragen werden. 

Diese Abfragen werden von dem Speicher- 
Verwaltungsprozessor PGM seguentiell verarbeitet, wobei 
dieser Prozessor dieselbe allgemeine Struktur aufweist, 
wie die bezuglich der Abbildung 17 beschriebene . Die 
35 Verarbeitung erfolgt wie folgt: 

1/ dnp: Anforderung nach nicht geteilten 
Daten. Der Block wird ubertragen und nimmt den Zustand 
ro.rw = 10 an. 



81 

2/ dl: Lese -Anforderung eines Blocks. 
Befindet sich der Block in dem Zustand "nicht 
ausgesandt" (ro.rw = 00) oder "zum Lesen ausgesandt" 
(ro.rw b 10), wird er Cibertragen und nimmt den Zustand 
5 ro.rw « 01 an oder beh&lt ihn. 

Befindet sich der Block in dem Zustand n zum 
Schreiben ausgesandt", wird die Anforderung in die 
Warteschlange AFIPO gestellt. Der Speicher- 
Verwaltungsprozessor PGM findet dann in dem Feld cpu des 

10 Speichers RAMFG die Adresse des Cache-Speichers MC i# . die 
die aktualisierte Version des angeforderten Blocks 
enthalt. Eine Abfrage fur das vollst&ndige Entladen wird 
dann auf dem Synchronisationsbus SYNCHRO nur an den 
Prozessor zur Aufrechterhaltung der Kohirenz PMCi, der dem 

15 betreffenden Cache- Speicher MC^ zugeordnet ist, 
ausgesandt, Diese Anforderung kann als adressierter Befehl 
bezeichnet werden. 

Man kann feststellen, da£ der Prozessor zur 
Aufrechterhaltung der KohSxenz PMC^ das zugeordnete 

20 Verwaltungsverzeichnis RG^ nicht zu konsultieren braucht, 
da der Speicher-Verwaltungsprozessor PGM wei£, daS er der 
einzige Besitzer der aktualisierten Kopie ist. Seine Rolle 
besteht lediglich darin, die Abfrage zu entnehmen und sie 
in der zugeordneten Warteschlange PIFOi abzulegen. 

25 3/ de: Lese-Anforderung eines Blocks, um darin 

zu schreiben. 

Befindet sich der Block in dera Zustand "nicht 
ausgesandt" (ro.rw ■ 00), wird er libertragen und nimmt den 
Zustand w zum Schreiben ausgesandt" (ro.rw = 01) an. 

30 Befindet sich der Block in dem Zustand "zum 

Lesen ausgesandt" (ro.rw = 10), dann sendet der Speicher- 
Verwaltungsprozessor einen allgemeinen Befehl fur das 
Ungtiltigmachen des Blocks und ubertrSgt dann den Block in 
dem Zustand "zum Schreiben ausgesandt" (ro.rw « 01). Der 

35 allgemeine Befehl bewirkt die Aktivierung aller 
Prozessoren zur Aufrechterhaltung der Koh&renz PMCj, die 
ganz genau dieseliien Operationen ausfuhren, wie die, die 
fur das System der Abbildung 10 beschrieben sind. 
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Befindet sich der Block in dem Zustand "zum 
Schreiben ausgesandt", daira wird die Anforderung in die 
Warteschlange AFIFO gestellt. Wie zuvor sendet der 
Speicher-Verwaltungsprozessor PGM einen Befehl, der nur 
5 fur den Besitzer der aktualisierten Kopie bestiinmt ist. 

4/ maj : Schreib-Anf orderung eines Blocks nach 
einem vollstandigen Entladen. 

Der Funktionsalgorithmus ist in diesem Fall 
genau derselbe, wie der bezfcglich Abbildung 17 fur den 
10 Prozessor PGM beschriebene. 

Es muS angemerkt werden, da£ das 
Schreibquittier-Problem in dieser Durchfuhrungsart ganz 
von selbst durch einen adressierten Quittierbef ehl gel&st 
wird. 

15 5/ ei: Informations-Schreiben. 

Dieser Fall wird direkt auf detn gemeinsamen 
Bus BUSA in der in Abbildung 10 dargestellten Architektur 
verarbeitet. In der hier angestrebten Durchfuhrungsart und 
urn die Synchronisation zu garantieren, wird diese 

20 Operation von dem Speicher-Verwaltungsprozessor PGM 
durchgefQhrt. 

Befindet sich der Block in dem Zustand "zum 
Lesen ausgesandt 11 , dann wird ein Befehl, der gleichzeitig 
allgemein und adressiert ist, gesandt: adressiert 
' 25 insofem, als da£ der betreffende Prozessor zur 
Aufrechterhaltung der Koharenz PMCj das Quittieren der 
Anforderung nach dem . Informations -Schreibvorgang 
registriert und den betreffenden Block im "modif ziert"- 
Zustand im Verwaltungsvereichnis RGj umsetzt, allgemein 

30 insofem, als daS alle anderen Prozessoren PMC* diesen 
Block in ihrem Verzeichnis ungiiltig machen mussen. 

Der Block in dem Zustand "zum Schreiben 
ausgesandt" zeigt an, daS wahrend der Wartezeit der 
Abfrageverarbeitung eine . Informations -Schreib-Anf orderung 

35 auf diesem selben Block verarbeitet worden ist. In diesem 
Fall wird die Informations -Schreib-Anf orderung in eine 
Schreib-Anf orderung de umgewandelt, und es folgt dieselbe 
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Verarbeitung, wie in dem dera Schreibvorgang entsprechenden 
Pall. 

Der parallele Synchronisationsbus SYNCHRO hat 
die Aufgabe, Blockadressen, die durch eine Prozessomummer 
5 und eine Anforderungsart mit einem PrSfix versehen sind, 
auszusenden, das sind circa 30 bis 40 Bit, je nach den 
Eigenschaften des Mehrprozessors. Diese Informatioaen 
werden aufierdem unidirektional ubertragen. Ihr Transfer 
kann auch hier wieder vorteilhaf terweise vlber eine 
10 Serienverbindung durchgefuhrt werden. Der Transfertakt ist 
weniger Jcritisch als fur die B16cke, und es k6nnen 
vereinfachte Ldsungen ins Auge gef afit werden, zum Beispiel 
mittels der von der Firma "A.M.D. n hergestellten "TAXI"- 
Schaltkreise. 

15 Abbildung 19 stellt einen Teil eines 

synoptischen Schemas einer erfindungsgemafien Architektur 
dar, in der mehrere Zentraleinheiten UC^ ... in Cluster 
zusammengefaSt sind und sich dieselbe Serienverbindung LS k 
teilen. 2u diesem 2weck hat ein lokaler, dem Cluster 

20 zugeordneter Arbiter ABL^ die Aufgabe, die 
Zugriffskonflikte mittels Blockadressen-Ubertragung zu 
schlichten, und er teilt sich mit dem Speicherprozessor 
PGM, der zu diesem Zweck ausgerustet ist, ein Signal 
busy k , das standig den freien Oder belegten Zustand der 

25 Serienverbindung LS^ angibt. Codierungs- und 
Decodierungsmittel eines Identif izierungskopf s des 
betreffenden Prozessors innerhalb eines Clusters sind den 
Sende- und Empfangslogiken der Datenblocke zugeordnet. 

In dem Fall, wo der gemeinsame Bus BUSA das 

30 Ubertragungsmittel fur die Blockadressen ist, ist die 
Funktionsweise wie folgt: 

Will die Zentraleinheit CPU^+j einen 
Blocktransfer vom Hauptspeicher RAM zum Cache- Speicher 
MC k+j (Fall dnp, elf de) oder einen Informations- 

35 Schreibvorgang ei vornehmen, dann fordert sie vom lokalen 
Arbiter ABL k den Zugriff auf den gemeinsamen Bus BUSA, 
der, wenn er an ' der Reihe ist, dera Arbiter AB die 
Anforderung weitergibt. Die Zugriff serlaubnis zum 
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gemeinsamen Bus BUSA wird an die Zentraleinheit CPU^+j 
zuruckgesandt, und der Transfer erfolgt in der bezilglich 
Abbildung 10 beschriebenen Weise. Jeder vom Hauptspeicher 
RAM zum Cache -Speicher MC^+j ubertragene Block xmiS dann 
5 identif iziert werden, da die Reihenfolge der Anforderungen 
nicht eingehalten wird, weil sie in die Warteschlange 
AFIFO des Speicher-Verwaltungsprozessors PGM gestellt 
werden kdnnen. Will die Zentraleinheit CPU^j einen 
Blocktransfer vora Cache -Speicher MC^+j zum Hauptspeicher 

10 RAM (Fall maj) vornehmen, dann fordert sie vom lokalen 
■ Arbiter ABL^ zuerst den Zugriff zu der Serienverbindung 

LS k . Der lokale Arbiter ABI* und der Speicher- 
Verwaltungsprozessor PGM " konnen sich beide die 
Serienverbindung LS k geben: ein Konflikt wird durch 

15 Synchronisation der Modif ikation des Signals busy^ mit dem 
Signal valid vermieden (der Speicher-Verwaltungsprozessor 
PGM kann einen Transfer nur wShrend einer 
Speichertransaktion starten oder erneut starten) . Die 
Belegungserlaubnis der Serienverbindung LS^ bringt die 

20 Zentraleinheit CPUk + j dazu, ihren Inforraationsblock zum 
Speicher-Schieberegister RDM^ zu ubertragen, und dann vom 
lokalen Arbiter ABL^ den Zugriff zum gemeinsamen Bus BUSA 
zu fordern, urn dort die Update -Anforderung vorzunehmen, 
die nach dem beziiglich Abbildung 10 beschriebenen 
' 25 Algorithmus erfolgt. Das Update- Schreiben kann bewirken, 
daS in der Warteschlange AFIFO des Speicher- 
Verwaltungsprozessors PGM ein Block freigemacht wird und 
ein belegtes Schieberegister RDMj gefordert wird. In 
diesem Fall wird der angeforderte Transfer verzdgert und 

30 mit dem sich in Gang befindlichen Transfer verkettet. 

In dem Fall, wo die Obertragungsmittel f\ir die 
Blockadressen die Serienverbindungen selbst sind, ist die 
Funktionsweise, was die Preemption der Serienverbindung 
betrif ft, identisch mit dem vorherigen Fall und, was den 

35 allgemeinen Funktionsalgorithmus betrif ft, identisch mit 
dem bezuglich Abbildung 17 beschriebenen, 

Zum Beispiel benotigt eine Lese-Anf orderung 
eines Blocks aus der Zentraleinheit CPU^j zuerst eine 
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Zugriffserlaubnis zu der Serienverbindung LS^; diese 
Erlaubnis wird vom lokalen Arbiter ABL^ in tibereinstimmung 
mit dem Speicher-Verwaltungsprozessor PGM gegeben. Die 
Zugriffserlaubnis fiihrt zum Transfer der Adresse des 
5 angeforderten Blocks auf der Serienverbindung LS^, die 
sogleich freigemacht wird: sie steht, wenn notig, ftir jede 
andere Transaktion zur Verfttgung. Eine Block-Schreib- 
Anforderung folgt demselben Protokoll fttr den Zugang zu 
der Serienverbindung LS^. 

10 In den bezUglich der. Abbildungen 1 bis 19 

beschriebenen Architekturen gab es genausoviele Speicher- 
Schieberegister RDMj vie Zentraleinheiten CPUjt eine 
Serienverbindung LSj ist einem Paar (RDMj # CPUj) statisch 
zugeordnet gewesen. 

15 Es muB of f ensichtlich venigstens eine 

Serienverbindung LSj zwischen einer Zentraleinheit und dem 
Hauptspeicher RAM geben, die Anzahl der Schieberegister 
RDMj kann jedoch niedriger sein. Tatsachlich ist es nicht 
moglich, wenn tacc die Zugriffsdauer auf den Hauptspeicher 

20 RAM und ttfr die Transferdauer eines Blocks ist, dafi mehr 
als n = ttfr/tacc gleichzeitig belegte Schieberegister 
beibehalten werden. Zum Beispiel erh&lt man fiir tacc = 100 
ns und ttfr « 1 200 ns: n « 12. 

Tacc und ttfr sind also charakteristische 

25 Leistungskriterien des erf indungsgemaBen 

Mehrprozessorsystems, und die Install ierung von n 
Speicher-Schieberegistem RDMj ist nur mit einer hoheren 
Anzahl von Serienverbindungen LSj kompatibel, und zwar 
unter der Bedingung, daB eine Logik vom Typ des 

30 verbundnetzes RI zwischen Registern und Verbindungen 
eingeschoben wird, wobei die Zuordnung eines 
Speicherregisters RDMj zu einer Serienverbindung LSj 
dynamisch vom Speicher-Verwaltungsprozessor PGM 
durchgeftihrt wird, 

35 Im librigen besteht der Hauptspeicher RAM im 

allgemeinen aus m parallel angeordneten SpeicherbSnken 
RAM 1 , ... RAW^, RAMjjj, wobei jede Speicherbank n 
Schieberegister RDMj, die durch ein Verbundnetz RI p mit 
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alien Serienverbindungen LSj verbunden sind, aufweist. Bs 
ist somit mogllich, unter dem Vorbehalt, daS die 
Blockadressen gleichmasig auf die Speicherbanke RAMp 
verteilt werden, eine theoretische Leistung von m x n 
5 gleichzeitig aktiven Schieberegistern zu erhalten. Filr die 
gleichm&Sige Verteilung der Adressen wird durch 
herk5mmliche Adressenverschachtelungs-Mechanismen gesorgt. 

In Abbildung 20a 1st eine erfindungsgetticLfie 
Architektur teilweise dargestellt, die m Speicherb§nke 

10 RAMp mit n Schieberegistern RDMj pro Speicherbank und q 
Zentraleinheiten UCj aufweist, Jede Speicherbank ist vora 
Typ mit Zufallsreihenfolgezugrif f und besitzt einen 
Dateneingang/-ausgang von der Breite eines 
Inf ormationsblocks bi, wobei dieser Eingang/Ausgang (wie 

15 zuvor bei dem Speicher RAM) durch einen parallelen Bus mit 
alien elementaren Registern RDM lp ... RDMj p verbunden ist. 

Das Verbundnetz ist von einer an sich 

bekannten Struktur ( "cross -bar" , "delta" , "banyan" ). 

Man kann feststellen, dafi ein mehrstufiges Netz in dem 

20 Mafie gut geeignet ist, wo die Dauer des Wegeaufbaus 
unbedeutend gering im Vergleich mit seiner Belegungsdauer 
ist (die Transferdauer eines Blocks) und dafi nur ein Bit 
pro Verbindung betroffen ist. 

Der Speicher-Verwaltungsprozessor PGM ist 

25 geeignet, urn fur die dynaraische Zuteilung eines Ausgangs 
zu einem Eingang des Netzes zu sorgen, das heifit, ein 
Speicher-Schieberegister RDMj, und eine Serienverbindung 
LS± in Verbindung zu brihgen. 

Bestehen die Blockadressen -Ubertragungsmittel 

30 aus dem gemeinsamen Bus BUSA, ist die Funktionsweise wie 
f olgt : 

Bei einer Lese-Anforderung eines Blocks durch 
die Zentraleinheit CPUj, teilt der betreffende Speicher- 
Verwaltungsprozessor PGMp ein Schieberegister RDM^ zu, 
35 steuert entsprechend das Verbundnetz RI und initialisiert 
den Transfer. 

Bei einer Schreib-Anf orderung eines Blocks 
durch die Zentraleinheit CPUj mug zuvor ein Weg aufgebaut 
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werden* Dazu wird eine erste Abfrage fxir den Wegaufbau auf 
dem gemeinsamen Bus BUSA ausgesandt, gefolgt von der 
eigentlichen Schreib-Anforderung sofort nach dem 
Blocktransfert vom Cache -Speicher MCj zura Schieberegister 
5 RDMi. Bei der ersten Anforderung hat der Speicher- 
Verwaltungsprozessor PGM die Aufgabe, einen Weg zuzuteilen 
und das Verbundnetz RI zu steuern. 

In dem Pall, wo die Blockadressen- 
Ubertragungsmittel die Serienverbindungen selbst sind, mug 

10 vor einem Transfer ein Weg aufgebaut werden. Dieses 

. Problem 1st mit dem herkommlichen Problem des Teilens 
einer Gesamtheit von n Hilfsmitteln durch m Benutzer 
identisch und kann durch herkoxnmliche Arbitrations - 
Ldsungen von Zugrif f skonflikten gei&st werden 

15 (Ubertragungsprotokolle, zusatzliche Signale) . 

In dem in Abbildung 5 dargestellten 
Architekturbei spiel, sind die Schieberegister RDMj und 
RDPj und deren Freigabelogiken LV1 und LV2 in einer 
schnellen Technologie ausgefuhrt worden, wobei das Ganze 

20 durch einen Taktgeber mit der Prequenz F von mindestens 
100 MHz synchronsiert worden ist. 

Abbildung 20b stellt als Variante der in 
Abbildung 20a vorgeschlagenen Architektur eine 
erf indungsgem&fie Ldsung dar, bei der jede Serienverbindung 
1 25 LSj, die den Prozessor CPUj mit alien Speicherb4nken 
verbindet, in m Serienverbindungen LSj p aufgeteilt ist und 
die Punkt zu Punkt den Prozessor CPUj mit jeder der 
SpeicherbSnke RAMp verbindet. 

Diese Vorgehensweise hat den folgenden 

30 doppelten Vorteil: 

- da jede Verbindung eine Punkt zu Punkt - 
Verbindung ist, kann sie, elektrisch Oder fur eine 
Glasfaser, besser angepafit werden, 

- sobald der Verarbeitungs- Prozessor in der 
35 Lage ist, Blockanf orderungen vorwegzunehmen , was zur Zeit 

bei den leistungsfahigsten Prozessoren der Pall ist, wird 
eine zusatzliche Parallelebene erreicht. 
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Die der Serienverbindung LSj auf der Seite des 
Prozessors CPUj zugeordnete Schnittstellenlogik (zuvor mit 
TPRj und RDPj bezeichnet) wird dann in m Exemplare I x ... 
Ip ... I m vervielfacht. Es kann das Vorhandensein einer 
5 Verbindung zur Auf rechterhaltung der KohSrenz der 
Information eigens fur jede Speicherbank RAMp festgestellt 
werden. Die Funktionsweise dieser Verbindung ist analog zu 
der des Busses SYNCHRO der Abbildung 18. 

In den Abbildungen 2 la und 21b vurde eine 

10 andere RAM-Speicherstruktur dargestellt, die 2 U 
Speicherebenen aufweist, wobei jede Speicherebene eine 
Breite von t/2 u Bin&rinf ormationen aufweist (aus Grunden 
der Klarheit wurden in Abbildung 21a die notwendigen Lese- 
Mittel eines Blocks bi, und in Abbildung 2 lb die 

15 notwendigen Schreib-Mittel dargestellt) . Die 
Schieberegister RDMj Oder RDPj bestehen aus 2 U elementaren 
Unterschieberegistern RDMjp mit einer Kapazitat von t/2 u 
Bit. Das in Abbildung 20 dargestellte Beispiel ist eine 
Ausfuhrung mit 8 Speicherebenen (u « 3) . (Aus Grunden der 

20 Klarheit der Zeichnung wurde nur ein einziges, aus alien 
Unterregister RDMjp gebildetes Schieberegister RDMj 
dargestellt) . Jede Speicherebene RAMp enthalt gegenuber 
seiner Zugrif fsbreite mehrere elementare Schieberegister 
RDMj p und kann mit einer Schiebefrequenz von mindestens 

25 P/2U funktionieren. 

Die Funktionsweise des Ganzen beim Lesen ist 
in Abbildung 21a dargestellt. Bin Block wird synchron aus 
alien 2 U Speicherebenen gelesen und genauso in die 
elementaren Register mit dem gleichem Stellenwert geladen. 

30 Die Serienausgange dieser Register sind an die Eingange 
eines Multiplexers MUXR, der in einer schnellen 
Technologie (ASGA) ausgefuhrt ist, angeschlossen. Bin 
genau angepafiter Schaltkreis dieses Typs ist bei "GIGABIT 
LOGIC" unter der Referenz "l0GO40 w verfugbar und kann ein 

35 logisches Signal mit einer Frequenz von 2,7 GHz ausgeben. 
Er liefert im ubrigen einen Taktgeber mit einer durch 8 
geteilten Frequenz, der den Schiebetaktgeber der 
elementaren Register RDMjp bildet. 
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Beim Schreiben wird eine syrametrische 
Funktionsweise, die in Abbildung 21b dargestellt ist, 
erreicht, und zwar mit einem Multiplex-Schaltkreis DMUXR 
desselben Herstellers {Referenz »10G41 n ) und mit denselben 
5 Eigenschaften beztiglich der LeistungsfShigkeit . 

Man erreicht so eine Transferfrequenz von 500 
MHz mit 8 elementaren Registern, die mit einer Frequenz 
von 500/8 = 62,5 MHz arbeiten, was es erm6glicht, diese 
elementaren Register in einer konventionelleren 
10 Technologie zu bauen ( w MOS n zum Beispiel) . 

Die oben angegebenen Multiplexer- und 
Demultiplexer-Schaltkreise sind in SStzen von 16 , 32, ... 
Bit kombinierbar . So ist es moglich, bei einer Zuordnung 
von 16 beziehungsweise 32 62,5-MHz-Speicherebenen, 
15 Datenraten von 1 und 2 GHz zu erhalten, das bedeutet ein 2 
bis 4 mal hoheres Leistungsniveau. 

Es mufi angemerkt werden, dafi die Logik TFR auf 
einera der elementaren Register durchgefuhrt werden kann 
und dafi die Freigabelogik LV in die n ASGA n -Schaltkreise 
20 (Ausgang mit offenem Kollektor) integriert 1st. 

Abbildung 22 stellt die allgemeine Struktur 
eines Bauteils vom Typ einer integrierten "VLSI"- 
Schaltkreis dar, die "Serienmultiportspeicher" genannt 
wird und geeignet ist, ein erf indungsgemafies 
■ 25 Mehrprozessorsystem auszurusten. Dieses Bauteil kann in 
der zuvor beschriebenen Mehrprozessor-Architektur genutzt 
werden, und zwar entweder urn den Hauptspeicher RAM und die 
zugeordneten Schieberegister RDMj auszufuhren Oder urn 
jeden Cache-Speicher MCj und dessen Schieberegister RDPj 
30 auszufuhren. Urn die Bezeichnungen zu vereinf achen, wurden 
in der nachf olgenden Beschreibung die Symbole fur den 
Hauptspeicher RAM und die zugeordneten Schieberegister 
beibehalten. 

Die Liste der Stifte dieses Schaltkreises mit 
35 den entsprechenden Signalen ist folgende: 

- adbloco-adbloc^!: m Adrefibits eines Blocks 

bi, 
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admoto-admotfc.i: k Wortadrefibits in dem 

Block, 

numrego-numregjj.i: n AdreSbits eines 

Registers rd, 

5 - cs: "chip select": Auswahlsignal des 

Schaltkreises, 

- wr: "write": Schreibsignal , 

- rd: "read": Lesesignal, 

bit /bloc: Steuersignal der 

10 Multiportfunktion, 

- normal /config: Signal fur Funktionsmodus, 

- data 0 -data 1 . 1 : 1 Datenbits, 

- ^l"^- n Taktgebersignale, 

- dx-dn: n Datensignale. 

15 Die Werte m, n und 1 sind vom aktuellen Stand 

der Technologie abhingig. Aktuelle Werte kdnnten folgende 
sein: 

- m = 16 das sind 2 1S Blocke bi von je 64 Bit 
(das sind 4 Mbit) , 

20 - n « 3 das sind 8 Register rd, 

1 « 8 das ist eine Byte-Typ- 
Parallelschnitts telle , 

- k = 3 aufgrund des Vorhandenseins von 8 Byte 

pro Block, 

.'25 Das angestrebte Bauteil weist circa funfzig 

Stifte auf . 

. Diese Schaltung "Multiportserienspeicher" 
besteht aus einem Schreib-Lese-Speicher mit 
Zufallsreihenfolgezugriff RAM mit einer vorbestimmten 

30 Breite t, die filr das Schreiben auf unabhangigen Fronten 
von einer Breite von t/4 (Beispielwert in Abbildung 22) 
und t/1 gesteuert werden kann. Die Datenleitungen dieses 
Speichers RAM sind rait den Eingangen einer Art "Trommel" - 
Logik BS ("Barrel shifter") Oder Multiplexierlogik MT, je 

35 nach der Version des Bauteils, verbunden, wobei die 
Multiplexierlogik MT so betrachtet werden kann, dafi sie 
eine Unterbaugruppe der Moglichkeiten der "Trommel" -Logik 
bietet und somit einfacher in der Ausfuhrung ist. Die 
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Adressen- und Steuersignale dieses Speichers RAM, das 
heifit csi, wri, rdi, adbloci werden von einer Steuerlogik 
COM ausgegeben. Diese Logik COM empfSngt aufcerdem die 
Informationssignale der Stifte cs, wr, rd, bit/bloc, 
5 normal /config und nutnreg und ist einerseits durch 
Steuerleitungen "Format 0 mit der Art ° Trommel "-Logik BS 
und andererseits mit dera Ausgang eines 
IConfigurationsregisters RCl und mit dem Eingang einer 
Auswahllogik LSR verbunden, die die Signale srdo, 

10 src^.! und src lr src 2 , und src 3 liefert. Die AusgSnge der 
"Trommel H -Logik BS bilden einen internen Bus zur 
parallelen Ubertragung BUSI, der mit mehreren 
Schieberegistern RD 0 , ... RD n . x verbunden ist, und zwar 
einerseits durch ihre parallelen Eing&nge und andererseits 

15 durch ihre ■ parallelen Ausgange uber die Preigabepuf f er 
BV100 0 , ... BVIOOjj.! und mit dem parallelen Eingang der 
Konfigurationsregister RC 1# RC 2 ... RCi. 

Die niederwertigeren 1-Bits des Busses BUSI 
werden ebenfalls auf den 1-Stif ten data 0 . . . data 1 . 1 

20 empfangen. Jedes Schieberegister RDi und zugeordnete 
Verknupfungen bilden eine funktionelle Einheit ELRDi , die 
durch mehrere logische Elemente gesteuert wird, die eine 
Setzlogik LF^ bilden. Jede funktionelle Einheit ELRDi 
weist Verknupfungen ETlOOi und ETiOli auf, die auf einem 

25 ihrer EingSnge mit dem Ausgang srdi der Auswahl logik LSR 
verbunden sind und die auf ihrem anderen Eingang das 
Signal rdi beziehungsweise empfangen. Der Ausgang der 
Verknilpfung ETlOOi ist mit dem Eingang loadlOOi des 
Schieberegisters RDi sowie mit dem Eingang loadlOlj und 

30 mit dem Eingang S eines ZcLhlers CPTIOO^ beziehungsweise 
einer Kippschaltung BlOOi, die zu der Setzlogik LF| 
gehort, verbunden. Der Ausgang der Verknxlpfung ETIOli ist 
mit dem Steuereingang der Freigabepuf fer BVl00i verbunden. 
Der Ausgang di ist an den Ausgang einer Verknupfung PL^ 

35 angeschlossen, die auf ihrem Dateneingang den 
Serienausgang des Schieberegisters RDj und auf ihrem 
Steuereingang den Ausgang einer Verknupfung OUlOOi 
empfangt. Das aus dem Stift hi kommende Signal wird an den 
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Kingang clklOOi des Registers RD^ sowie an den Eingahg 
downlOOi des Zahlers CPTlOOi ausgegeben. Der Ausgang 
zfirolOOi des ZShlers CPTlOOi ist mit dem Eingang R der 
Kippschaltung BlOOi verbunden. 
5 Die Setzlogik LFjl weist des weiteren einen 

Multiplexer MUXlOO^ auf , der auf seinen Dateneingangen die 
Werte t und t/4 empfSngt. Der Datenausgang des 
Multiplexers MUXlOOi ist mit dem Dateneingang des Zahlers 
CPTlOOi verbunden, und der Auswahlsteuereingang sellOOi 

10 des Multiplexers MUXlOOi ist mit dem Ausgang 1 des 
j Registers RCx verbunden, Der Ausgang Q der Kippschaltung 
BlOOi ist mit einem der EingSnge einer Verkmipfung ET102 i 
verbunden, die auf ihrem anderen Eingang das Signal aus 
dem Stift i eines Registers RC2 empfangt. Der Ausgang der 

15 Verknipfung ET102i ist mit einem der Eing&nge der 
Verkmipfung OUlOOi verbunden, die auf ihrem anderen 
Eingang das Signal aus dem Stift i eines Registers RC 3 
empfangt. Die Ladeeing&nge der Register RC lt RC 2 und RC 3 
empfangen das Signal src 1# src 2 beziehungsweise src 3 aus 

20 der Auswahllogik LSR . 

Dieses Bauteil besitzt eine doppelte 
Punktionsweise : befindet sich das Signal bit/bloc in dem 
Zustand "bit*, dann funktioniert dieses Bauteil wie ein 
konventioneller Halbleiterspeicher: die Signale adbloc, 
' 25 die den Signalen admot zugeordnet sind, bilden den 
AdreSbus in Worteinheiten (im Beispiel 8 Bit) , die Signale 
cs, rd und wr haben die normalerweise diesen Signalen 
zugeordnete Richtung und die Stifte data ubertragen die 
Daten. 

30 Intern beim Lesen wird der mit adbloc 

bezeichnete Inf ormationsblock im RAM-Speicher gelesen und 
dem Eingang der Trommel -Logik BS oder der 
Multiplexierlogik MT vorgelegt. Die Kombination der 
Signale admot und bit/bloc ermoglichen der Steuerlogik 

35 COM, der Trommel -Logik BS oder der Multiplexierlogik MT 
die Signale "format" zu liefern. Das betreffende Wort wird 
dann rechtsbundig am Ausgang der Trommel - Logik oder 
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Multiplexierlogik ausgerichtet und so auf den Datenstiften 
data vorgelegt. 

Intern beim Schreiben, wird das auf den 
Datenleitungen data vorgelegte Wort durch die Trommellogik 
5 BS oder Multiplexierlogik MT btindig ausgerichtet, und zwar 
durch dieselben Formatierungssteuersignale wie beim Lesen r 
gegentiber seiner Position in dem Block. Die Steuerlogik 
COM sendet dann ein partielles Schreibsignal vri auf den 
einzigen betreffenden "Teilabschnitt" des Speichers und an 

10 die von den Signalen adbloc bezeichnete Adresse. 

Befindet sich das Signal bit/bloc im Zustand 
"bloc", dann hangt die Funktionsweise vom Zustand des 
Signals normal /config ab. Der Modus config programmiert 
die Konf igurationsregister RC 1# RC 2 und RC 3 , die von den 

15 Signalen numreg adressiert und durch die Datenleitungen 
data programmiert warden. Das Register RC 1 ermoglicht die 
Modifikation der BlockgroBe: t und t/4 im Beispiel, das 
sind 64 Bit und 16 Bit. Intern ist der Funktionsmodus 
ahnlich dem, der in dem Funktionsmodus "bit" beschrieben 

20 ist: t oder t/4 Bits werden auf dem internen Bus BUSI (sum 
Lesen) bxindig oder gegentiber dem betreffenden 
"Teilabschnitt" des Blocks (fiir das Schreiben) 
ausgerichtet. Es k<3nnen Vielfach-BlockgroBen ins Auge 
gefaBt werden (t, t/2, t/4 . ..)• 

25 Das Register RC 3 ermoglicht fiir jedes Register 

die Wahl einer st&ndigen Funktionsrichtung: entweder ftir 
die Eingabe (RC3i = 0) oder fiir die Ausgabe ('RC2 i - 1) . 
Durch diese bestSndige Richtung kann das Bauteil an die 
Serienverbindungen mit unidirektionalen standigen DrShten 

30 angepaBt werden. Das Register RC 2 ermoglicht, unter dem 
Vorbehalt, daB sich das entsprechende Bit des RC 3 im 
Logikzustand 0 befindet, fiir jedes Register die Auswahl 
eines Funktionsmodus mit wechselnden bidirektionalen 
Drahten: bei einem RAM-Speicher lesen geht das betreffende 

35 Schieberegister RDj_ fiir die Dauer der ttbertragung des 
Blocks in den Ausgabemodus und geht dann im Eingabemodus 
in den Ruhezustand zurCick. Intern wird die Kippschaltung 
B100 i# die die Verkniipfung PI^ steuert, bei einem 
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Lades ignal des Registers RDM^ auf Bins gesetzt und nach 
dem Transfer der t Oder t/4 Bits auf Null zuziickgesetzt, 
und zwar mittels des ZShlers CPTlOOi, der, je nach dem 
Zustand des Registers RC lf auf t oder t/4 initialisiert 
5 worden ist und der auf seinem Z&hleingang die Impulse des 
Taktgebers hi empfangt. Bei dem normalen Betriebstnodus fir 
das Lesen (Signal normal /config im Normalzustand) wird der 
von den Stiften adbloc adressierte Block in das Register 
RDi geladen, das von den Stiften numreg adressiert wird. 

10 ist der Block ein Teilblock (t/4) , dann wird er in der 
niederwertigeren Position durch die Trommel -Logik BS Oder 
Multiplexierlogik MT auf dem internen Bus BUSI ubertragen. 
Dieser Block wird dann sofort nach Aktivierung des 
Taktgebersignals hi ubertragen. 

15 Bei dem normalen Betriebstnodus fur das 

Schreiben wird der Inhalt des von den Stiften numreg 
adressierten Registers RD^ in den Speicherblock RAM an der 
Adresse adbloc geschrieben. Ist der Block ein Teilblock, 
wird er in der hoherwertigeren Position auf dem internen 

20 Bus BUSI ubertragen und dann gegenuber von dem betref- 
fenden H Teilabschnitt w des Blocks durch die Trommel -Logik 
BS oder die Multiplexierlogik MT bundig ausgerichtet, und 
schliefilich wird ein partielles Schreibsignal wri auf den 
betreffenden Teilabschnitt gesandt. * • ' m 

25 Es mu£ angemerkt werden, daS, wenn sich ein 

Teilblock in Betrieb befindet, die Adresse dieses 
Teilblocks dann in den Block von den AdreSleitungen admot 
geliefert wird. 

Dieses Bauteil ist perfekt an die 

30 verschiedenen beschriebenen Architekturvarianten angepaSt. 
Parallel angeordnet ermoglichen 8 r 16 ... Schaltkreise 
dieses Typs die Ausfuhrung der in den Abbildungen 20a und 
20b beschriebenen Vorrichtung. Ist der RAM-Speicher in 
einer schnellen Technologie ausgefilhrt, dann kann dieses 

35 Bauteil auch in dem Cache- Speicher verwendet werden, indem 
die internen Register eines selben Bauteils gem&£ der in 
den Abbildungen 20a und 20b beschriebenen Vorrichtung 
multiplexiert werden. 
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patentansprOche 

1/ - Mehrprozessorsystem, das einen 
Hauptspeicher (RAM) aufweist, der in Inf ormationsblocken 
(bi) angeordnet ist, Verarbeitungs-Prozessoren (CPU-^ . 
5 CPUj ... CPU n ) , einen Cache-Speicher (MCj), der mit jedem 
Verarbeitungs-Prozessor (CPUj) verbunden ist und in 
Inf ormationsblocken (bi) angeordnet ist, die genauso groB 
sind, wie die des Hauptspeichers, ein Verzeichnis (RGj) 
und dessen Verwaltungsprozessor (PGj), das jedem Cache- 

10 Speicher ( MC j) zugeordnet ist, wobei das besagte 
Mehrprozessorsystem dadurch gekennzeichnet ist, dafi es 
ausgestattet ist: 

. mit mehreren Schieberegistern, sogenannten 
Speicherregistern (RDM X . . . RDMj . . . RDM^ , wobei jedes 

15 dieser Register (RDMj) einer Transferlogik (TFRj) 
zugeordnet und so an den Hauptspeicher (RAM) angeschlossen 
ist, dafi innerhalb eines Zyklus dieses Speichers ein 
Paralleltransfer zum Lesen Oder Schreiben eines 
Informationsblocks (bi) zwischen dem besagten Register und 

20 dem besagten Hauptspeicher moglich ist, 

mit Schieberegistern, sogenannten 
Prozessorregistern (RDP 1 — RDPj . . . RDP n ) , wobei jedes 
Prozessor-Schieberegister (RDPj) einer Transferlogik 
(TFR 1 j ) zugeordnet und so mit dem Cache-Speicher (MCj) 

25 eines Prozessors (CPUj) verbunden ist, daB ein 
Paralleltransfer zum Lesen Oder Schreiben eines 
Informationsblocks (bi) zwischen dem besagten 
Schieberegister (RDPj) und dem besagten Cache-Speicher 
(MCj) moglich ist, 

30 . mit mehreren Serienverbindungen (LS^ . . . LSj 

... LS n ) , von denen jede ein Speicher-Schieberegister 
(RDMj) mit einem Prozessor-Schieberegister (RDPj) 
verbindet und geeignet ist, den Transfer von 
Inf ormationsblocken (bi) zwischen den beiden betroffenen 

35 Registern (RDMj, RDPj) mit einer Transf erf requenz F von 
mindestens 100 Megahertz zu ermdglichen, 

mit Mitteln fur die ttbertragung von 
Blockadressen, die ein Zusatz-Schieberegister (RDCr) 
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aufweisen # das so auf jeder Serienverbindung (LSj) 
parallel an das entsprechende Speicher-Schieberegister 
(RDMj) angeschlossen ist, daB die tibertragung der Adressen 
liber die Serienverbindungen und das Laden dieser Adressen 
5 in die besagten Zusatz-Schieberegister (RDCj) moglich ist, 
wobei ein Zugrif f sverwaltungsarbiter (ABM) mit den 
besagten Zusatz-Schieberegistern (RDCj) und dem 
Hauptspeicher (RAM) verbunden ist, urn die in den besagten 
Registem (RDCj) enthaltenen Adressen zu holen und die 

10 Zugriffskonflikte zum Hauptspeicher (RAM) zu vervalten, 
und die jedem Prozessorregister (RDPj) zugeordnete 
i Transferlogik (TRFj) so von dem Verwaltungsprozessor (PGj) 

gesteuert wird, daB die ttbertragung der Adressen iiber das 
besagte Prozessorregister (RDPj) moglich ist. 

15 2/ - Mehrprozessorsystem, das einen 

Hauptspeicher (RAM) aufweist, der in Informationsblocken 
(bi) angeordnet ist, Verarbeitungs-Prozessoren (CP^ ... 
CPUj ... CPU n ), einen Cache-Speicher {MCj), der mit jedem 
Verarbeitungs-Prozessor (CPUj) verbunden ist und in 

20 Informationsblocken (bi) angeordnet ist, die genauso groB 
sind, wie die des Hauptspeichers , ein Verzeichnis (RGj) 
und dessen Verwaltungsprozessor (PGj), das jedem Cache- 
Speicher (MCj) zugeordnet ist, wobei das besagte 
Mehrprozessorsystem dadurch gekennzeichnet ist, daB es " 

25 ausgestattet ist: 

. mit mehreren schieberegistern, sogenannten 
Speicherregister (RDM^ ... RDMj ... RDM n ) , wobei jedes 
dieser Register (RDMj) einer Transferlogik (TFRj) 
zugeordnet und so an den Hauptspeicher (RAM) angeschlossen 

30 ist, daB innerhalb eines Zyklus dieses Speichers ein 
Paralleltransfer zum Lesen oder Schreiben eines 
Informationsblocks (bi) zwischen dem besagten Register und 
dem besagten Hauptspeicher moglich ist, 

mit Schieberegistern, sogenannten 

35 Prozessorregistern (BDV 1 ... RDPj ... RDP n ) , wobei jedes 
Prozessor-Schieberegister (RDPj ) einer Transferlogik 
(TFR 1 j) zugeordnet und so mit dem Cache-Speicher (MCj) 
eines Prozessors (CPU.:) verbunden ist, daB ein 
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Paralleltransfer zum Lesen oder Schreiben eines 
Informationsblocks (bi) zwischen dem besagten 
Schieberegister (RDPj) und dem besagten Cache-Speicher 
(MCj) moglich ist, 
5 . mit mehreren Serienverbindungen (LS^ . LSj 

... LS n ) , wobei jede davon ein Speicher-Schieberegister 
(RDMj) mit einem Prozessor-Schieberegister (RDPj) 
verbindet und geeignet ist, den Transfer von 
Informationsblocken (bi) zwischen den beiden betroffenen 

10 Registern (RDMj, RDPj) mit einer Transf erf requenz F von 
mindestens 100 Megahertz zu ermoglichen, 

mit Mitteln fur die tJbertragung von 
Blockadressen, die. einen gemeinsamen Bus. fiir die parallele 
ttbertragung von Blockadressen (BUSA) aufweisen, der die 

15 Prozessoren (CPUj) mit dem Hauptspeicher (RAM) verbindet, 
und einen Busarbiter (AB) , der geeignet ist, die 
Zugriffskonf likte zu dem besagten Bus zu verwalten, wobei 
der Verwaltungsprozessor (PGj) mit dem gemeinsamen Bus 
(BUSA) so verbunden ist, daB die Obertragung der Adressen 

20 auf dem besagten gemeinsamen Bus moglich ist. 

3/ - Mehrprozessor system .nach einem der 
Ansprtiche 1 oder 2, dadurch gekennzeichnet, daB: 

- jedes Speicher-Schieberegister (RDMj) und 
jedes Prozessor-Schieberegister (RDPj) in zwei Register 

25 aufgeteilt ist, wobei das eine ftlr den Transfer in die 
eine Richtung und das andere fur den Transfer in die 
andere Richtung spezialisiert ist, 

jede Serienverbindung (LSj) zwei 
unidirektionale Seriendrahte fiir einen bit-fiir-bit- 

30 Transfer aufweist, die das aufgeteilte Speicher- 
Schieberegister (RDMj) und das entsprechende aufgeteilte 
Prozessor-Schieberegister (RDPj ) miteinander verbinden, 
wobei diese Drahte an den besagten Registern angeschlossen 
sind, und der eine den Transfer in die eine Richtung und 

35 der andere den Transfer in die andere Richtung ermoglicht. 

4/ - Mehrprozessorsystem nach einem der 
Anspruche 1 oder 2, dadurch gekennzeichnet, daB jede 
Serienverbindung (LSj ) einen bidirektionalen Draht fiir den 
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bit-fiir-bit-Transfer aufweist, der an. das Speicher- 
Schieberegister (RDMj) und an das entsprechende Prozessor- 
Schieberegister (RDPj) angeschlossen ist sowie eine Logik 
(LV) fiir die Freigabe\ der Transf errichtung, sodaB ein 
5 wechselnder Transfer in beide Richtungen moglich ist, 

5/ - Mehrprozessorsystem nach einem der 
Anspriiche 1, 2, 3 oder 4, das Verwaltungsmittel fiir 
zwischen Prozessoren geteilte Daten zur Erhaltung ihrer 
Koharenz aufweist. 

10 6/ - Mehrprozessorsystem nach Anspruch 5, 

dadurch gekennzeichnet, daB die Verwaltungsmittel der 
geteilten Daten folgendes aufweisen: 

einen speziellen Bus fiir die parallele 
Wortiibertragung (BUSD) , der die Prozessoren (CPUj) mit dem 

15 Hauptspeicher (RAM) verbindet, 

eine Partitionslogik (LPj), die jedem 
Prozessor (CPUj) zugeordnet ist und die geeignet ist, die 
Adressen der geteilten und der nicht geteilten Daten zu 
unterscheiden, um sie auf den Adressen-Obertragungsmitteln 

20 mit ihrer Identif izierung zu tibertragen, 

eine Decodierungslogik (DEC) , die dem 
Hauptspeicher (RAM) zugeordnet ist und die geeignet ist, 
die Adressen mit ihrer Identif izierung aufzunehmen xmd die 
Daten am Speicher ausgang weiterzuleiten, entweder, was die 

25 nicht geteilten Daten betrifft, zum entsprechenden 
Speicher-Schieberegister (RDMj) oder, was die geteilten 
Daten betrifft, zu dem speziellen Bus ftir die 
Wortiibertragung (BUSD) . 

7/ - Mehrprozessorsystem nach Anspruch 5, 

30 dadurch gekennzeichnet , daB die Verwaltungsmittel der 
geteilten Daten einerseits einen speziellen Bus fiir die 
parallele Wortiibertragung (BUSD) und einen speziellen 
gemeinsamen Bus fiir die Wortadresseniibertragung (BUS AM) 
aufweisen, die die Prozessoren (CPUj) und den 

35 Hauptspeicher (RAM) miteinander verbinden und andererseits 
eine jedero Prozessor (CPUj) zugeordnete Partitionslogik 
(LPj) aufweisen, die geeignet ist, die Adressen der 
geteilten Daten und die der nicht geteilten Daten zu 



99 



unterscheiden und die ersten zu dem speziellen gemeinsamen 
Bus (BUS AM) und die zweiten zu den Mitteln fUr die 
t)bertragung von Blockadressen weiterzuleiten. 

8/ -Mehrprozessorsystem nach den Ansprfichen 1 
5 und 5 zusammen, dadurch gekennzeichnet, daft die 
Verwaltungsmittel der geteilten Daten einen dem 
Hauptspeicher (RAM) zugeordneten Speicherverwaltungs- 
Prozessor (PGM) aufweisen sowie einen jedem Verarbeitungs- 
Prozessor (CPUj) und dem entsprechenden 

10 Verwaltungsverzeichnis (RGj) zugeordneten Prozessor fiir 
die Aufrechterhaltung der Koharenz der geteilten Daten 
(PMCj), wobei jeder Prozessor zur Aufrechterhaltung der 
Koh&renz (PMCj) an einen von dem Speicherverwaltungs- . 
Prozessor (PGM) gesteuerten Synchronisationsbus (SYNCHRO) 

15 so angeschlossen ist, daB bei Entdecken einer Blockadresse 
ein Update des Hauptspeicher s (RAM) und des zugeordneten 
Cache-Speichers (MCj) moglich ist und bei jeder 
Adressenentnahme aus den Zusatz-Schieberegistern (RDCj) 
ein Update des Hauptspeichers (RAM) und der Cache-Speicher 

20 (MCj) . 

9/ - Mehrprozessorsystem nach den Anspriichen 2 
und 5 zusammen, dadurch gekennzeichnet, daB die 
Verwaltungsmittel * der geteilten Daten einen dem 
Hauptspeicher (RAM) zugeordneten Speicherverwaltungs- 

25 Prozessor (PGM) aufweisen sowie einen jedem Verarbeitungs- 
Prozessor (CPUj) und dem entsprechenden 

Verwaltungsverzeichnis (RGj) zugeordneten Busspion- 
Prozessor (PEj), wobei jeder Busspion-Prozessor (PEj) und 
der Speicherverwaltungs-Prozessor (PGM) an den AdreBbus 

30 (BUSA) angeschlossen ist, urn die auf dem besagten Bus 
iibertragenen Blockadressen zu Uberwachen beziehungsweise 
zu verarbeiten, damit bei Entdecken einer in dem 
zugeordneten Verzeichnis (RGj) vorhandenen Blockadresse 
ein Update des Hauptspeichers (RAM) und des zugeordneten 

35 Cache-Speichers (MCj) moglich ist, 

10/ - Mehrprozessorsystem nach den Anspriichen 2 
und 5 zusammen, dadurch gekennzeichnet, daB die 
Verwaltungsmittel der geteilten Daten einen dem 
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Hauptspeicher (RAM) zugeordneten Speicherverwaltungs- 
Prozessor (PGM) und einen Prozessor zur Auf rechterhaltung 
der Koharenz der geteilten Daten (PMCj) aufweisen, der 
jedem Verarbeitungs-Prozessor (CPUj) und dem 
5 entsprechenden Verwaltungsverzeichnis (RGj) zugeordnet 
ist, wobei jeder Prozessor zur Aufrechterhaltung der 
Koharenz (PMCj) : an einen Synchronisationsbus (SYNCHRO) 
angeschlossen ist, der von dem Speicherverwaltungs- 
Prozessor (PGM) so gesteuert wird, daB bei Entdecken einer 

10 Blockadresse ein Update des Hauptspeichers (RAM) und des 
zugeordneten Cache-Speichers (MCj) und bei jeder 
Adressenentnahme auf dem gemeinsamen AdreBbus (BUSA) ein 
Update des Hauptspeichers (RAM) und der Cache- Speicher 
(MCj) moglich ist, 

15 11/ - Mehrprozessorsystem nach einem der 

Anspriiche 1 bis 10 , dadurch gekennzeichnet, daB: 

mehrere, einem bestimmten Satz von 
Prozessoren (CPU^, cpu k+l entsprechende Prozessor- 

Schieberegister (RDP^, RDPfc+i •••) parallel an eine selbe 

20 Serienverbindung (LSfc) angeschlossen sind, wobei jedem 
Satz von Prozessoren (CPU^, CPU k+1 . ..) ein lokaler 
Arbiter (ABL^) zugeordnet ist, um die Zugriff skonf likte zu 
der Serienverbindung (LS^) zu losen, 

- ein Speicherverwaltungs-Prozessor (PGM) mit 
25 den Mitteln ftir die tJbertragung von Blockadressen und mit 

dem Hauptspeicher (RAM) verbunden ist und Codierungsmittel 
besitzt, um jedem Informationsblock (bi) einen Kopf zur 
Identif izierung des betroffenen Prozessors aus jedem Satz 
der Prozessoren (CPU^, CPU )c+1 ...)/ die sich eine 
30 Datenserienverbindung (LS^) teilen, zuzuordnen, 

- die Verwaltungsprozessoren (PG^, P( *k+i •••)# 
die den Cache-Speichern (MC^, Mc jc+i •••) ( * er Prozessoren 
aus dem zuvor genannten Satz (CPU^, CPU k+1 . ..) zugeordnet 
sind, Mittel fur die Decodierung des Identif izierungskopfs 

35 aufweisen. 

12/ - Mehrprozessorsystem nach einem der 
Ansprtiche 1 bis 11, dadurch gekennzeichnet, daB jedes 
Speicher-Schieberegister (RDM-;) statisch an eine dem 
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besagten Register spezifisch zugeordnete Serienverbindung 
(LSj) angeschlossen ist. 

13/ - Mehrprozessorsystem nach einem der 
Anspriiche 1 bis 11, dadurch gekennzeichnet, daB: 
5 - ein Speicherverwaltungs-Prozessor (PGM) dem 

Hauptspeicher (RAM) zugeordnet ist und eine Logik (ALLOC) 
ftir die Zuordnung der Speicher-Schieberegister zu den 
Serienverbindungen aufweist, 

- die Speicher-Schieberegister (RDM 1 ... RDMj 

10 ... RDMj^) dynamisch an die Serienverbindungen (LS X ... LSj 
...) angeschlossen sind, und zwar mittels eines 
Verbundnetzes (RI) , das vom Speicherverwaltungs-Prozessor 
(PGM) gesteuert wird. 

14/ - Mehrprozessorsystem nach einem der 

15 Anspriiche 1 bis 13, in dem der Hauptspeicher (RAM) aus m 
parallel angeordneten SpeicherbSnken (RAM 1 . . . RAMp . . . 
RAM m ) besteht, dadurch gekennzeichnet, daB jedes Speicher- 
Schieberegister (RDMj) aus m elementaren Schieberegistern 
(RDMj^ ....RDMjp ... RDMj m ) besteht, die parallel mit der 

20 entsprechenden Serienverbindung (LSj) verbunden sind, 
wobei jedes elementare Register (RDMjp) an eine 
Spelcherbank (RAMp) so angeschlossen ist, daB innerhalb 
eines Zyklus der' besagten Speicherbank ein paralleler 
Transfer zum Lesen oder Schreiben eines Informationsblocks 

25 (bi) zvischen dem besagten elementaren Register und der 
besagten Speicherbank moglich ist. 

15/ - Mehrprozessorsystem nach Anspruch 14, in 
dem jede Serienverbindung (LSj) in m Serienverbindungen 
(LSjp) aufgeteilt ist, die Punkt zu Punkt jeden Prozessor 

30 (CPUj) mit dem elementaren Schieberegister (RDMjp) 
verbinden. 

16/ - Mehrprozessorsystem nach Anspruch 14, in 
dem auf jede Speicherbank (RAMp) mit Zuf allsreihenfolge 
zugegriffen wird und das einen Dateneingang/-ausgang von 
35 einer einem Informationsblock (bi) entsprechenden Breite 
besitzt, dadurch gekennzeichnet, daB der besagte 
Eingang/Ausgang t jeder Speicherbank (RAM p ) durch einen 
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parallelen Bus mit den elementaren Registern (RDM lp . . . 
RDMjp) verbunden ist. 

17/ - Mehrprozessorsystem nach einem der 
Anspriiche 14, 15 oder 16, das von einem Taktgeber mit 
5 einer Frequenz F von mindestens 100 Megahertz 
synchronisiert wird, dadurch gekennzeichnet, daB jedes 
elementare Speicher-Schieberegister (RDMjp) und jedes 
Prozessor-Schieberegister (RDPj) eine Schiebefrequenz von 
mindestens F haben kann. 

10 18/ Mehrprozessorsystem nach einem der 

Anspriiche 14, 15 oder 16, das von einem Taktgeber mit 
einer Frequenz F von mindestens 100 Megahertz 
synchronisiert wird, dadurch gekennzeichnet, daB jedes 
elementare . Speicher-Schieberegister und/oder jedes 

15 Prozessor-Schieberegister aus mehreren 2 U multiplexierten 
Unterregistern (RDMjp, RDPj p ) besteht, wobei jedes eine. 
Schiebefrequenz von mindestens F/2 U haben kann- 

19/ - Verfahren zum Inf ormationsaustausch 
zwischen einem in Inf ormationsblbcken (bi) angeordneten 

20 Hauptspeicher (RAM) und Prozessoren (CPU^ . • • cPUj . • . 
CPU n ) , wobei jeder mit einem in Blocken von derselben 
Gr6Be (bi) angeordneten Cache- Speicher (MCj) und mit einem 
Verzeichnis (RGj) ' und dessen Verwaltungsprozessor (PGj) 
ausgestattet ist, so daB der Austausch zwischen 

25 Hauptspeicher (RAM) und jedem Prozessor (CPUj) Qber den 
cache-Speicher (MCj) dieses letzteren erfolgt, wobei das 
besagte Verfahren dadurch gekennzeichnet ist: 

daB jeder Transfer eines Inf ormationsblocks (bi) vom 
Hauptspeicher (RAM) zum Cache-Speicher (MCj) eines 

30 gegebenen Prozessors (CPUj) mit einer Transfer frequenz F 
von mindestens 100 Megahertz erfolgt und darin besteht : 

innerhalb eines Hauptspeicher-Zyklus den 
Block (bi) von dem besagten Hauptspeicher (RAM) zu einem 
Speicher-Schieberegister (RDMj) von der GroBe eines Blocks 

35 zu ubertragen, wobei das Speicher-Schieberegister eines 
von mehreren an den Hauptspeicher angeschlossenen 
Schieberegistern (RDM^ ... RDMj, ... RDM n ) ist, 
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den Inhalt des Speicher-Schieberegisters 
(RDMj) auf einer Serienverbindung (LSj) zu einem 
Prozessor-Schieberegister . (RDPj) von der gleichen 
Kapazitat zu tibertragen, das dem Cache-Speicher (MCj) des 
5 betreffenden Prozessors (CPUj) zugeordnet ist, 

den Inhalt des besagten Prozessor- 
Schieberegisters (RDPj) zu dem besagten Cache-Speicher 
(MCj) zu tibertragen, 

- daB der Adressentransfer eines Informationsblocks nit 
10 der Transferfrequenz F iiber die Serienverbindungen 

erfolgt. 

20/ - Verfahren zum Informationsaustausch 
zwischen einem in Inf ormationsblocken (bi) angeordneten 
Hauptspeicher (RAM) und Prozessoren (CPI^ CPUj ... 

15 CPU n ) , wobei jeder mit einem Cache-Speicher (MCj), der in 
BlScken von der gleichen Kapazitat (bi) angeordnet ist, 
und mit einem Verzeichnis (RGj) und dessen 
Verwaltungsprozessor (PGj) ausgestattet ist, so daB der 
Austausch zwischen Hauptspeicher (RAM) und jedem Prozessor 

20 (CPUj) Clber den Cache-Speicher (MCj) dieses letzteren 
erfolgt, wobei das besagte Verfahren dadurch 
gekennzeichnet ist, daB: 

- jeder Transfer eines Informationsblocks (bi) vom 
Hauptspeicher (RAM) zum Cache-Speicher (MCj) eines 

25 gegebenen Prozessors (CPUj) mit einer Transferfrequenz F 
von mindestens 100 Megahertz erfolgt und darin besteht: 

innerhalb eines Hauptspeicher-Zyklus den 
Block (bi) von dem besagten Hauptspeicher (RAM) zu einem 
Speicher-Schieberegister (RDMj) von der GroBe eines Blocks 

30 zu tibertragen , wobei das Speicher-Schieberegister eines 
von mehreren an den Hauptspeicher angeschlossenen 
Schieberegistern (RDM X ... RDMj, ... RDM n ) ist, 

den Inhalt des Speicher-Schieberegisters 
(RDMj) auf einer Serienverbindung (LSj) zu einem 

35 Prozessor-Schieberegister (RDPj) von der gleichen 
Kapazitat, das dem Cache-Speicher (MCj) des betreffenden 
Prozessors (CPUj) zugeordnet ist, zu ubertragen, 
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den Inhalt des besagten Prozessor- 
Schieberegisters (RDPj) zu dem besagten Cache-Speicher 
(MCj) zu ttbertragen, 

-. dafl der Adressentransf er eines Informationsblocks 
5 mittels eines gemeinsamen parallelen AdreBbusses (BUSA) 
erfolgt. 

21/ - Verfahren zum Inf ormationsaustausch 
zwischen einem in Informationsblocken (bi) angeordneten 
Hauptspeicher (RAM) und Prozessoren (CPU 1 . • • CPUj - . - 

10 CPU n ) , wobei jeder Bit einem Cache-Speicher (MCj), der in 
Blocken der gleichen Kapazitat (bi) angeordnet ist, und 
mit einem Verzeichnis (PGj) und dessen 
Verwaltungsprozessor (PGj) ausgestattet ist f so daB der 
Austausch zwischen Hauptspeicher (RAM) und jedem Prozessor 

15 (CPUj) Qber den Cache-Speicher (MCj) dieses letzteren 
erfolgt, wobei das besagte Verfahren dadurch 
gekennzeichnet ist: 

- daB jeder Transfer eines Informationsblocks (bi) vom 

Cache-Speicher (MCj) eines gegebenen Prozessors (CPUj) zum 
20 Hauptspeicher (RAM) mit einer Transferfrequenz F von 

mindestens 100 Megahertz erfolgt und darin besteht : 

. den Block (bi) des besagten betreffenden 

Cache-Speichers (MCj ) zu einem dem besagten Cache-Speicher 

(MCj) zugeordneten Prozessor-Schieberegister (RDPj) von 
25 der GroBe eines Blocks zu ttbertragen, 

den Inhalt des Prozessor-Schieberegisters 

(RDPj) auf einer Serienverbindung (LSj) zu einem Speicher- 

Schieberegister (RDMj) mit der gleichen Kapazitat zu 

ttbertragen, das dem betreffenden Prozessor der an den 
30 Hauptspeicher (RAM) angeschlossenen Schieberegistern (RDM^ 

... RDMj ... RDMjj) zugeordnet ist, 

. innerhalb eines Zyklus des Hauptspeichers den 

Inhalt des Speicher-Schieberegisters (RDMj) zu dem 

besagten Hauptspeicher (RAM) zu ttbertragen, 
35 - daB der Adressentransf er eines Informationsblocks mit 

der Transf erfrequenz F ttber die Serienverbindungen 

erfolgt. 
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22/ - Verfahren zum Inf ormationsaustausch 
zwischen einem in Informationsblocken (bi) angeordneten 
Hauptspeicher (RAM) und Prozessoren (CPU^ . - . CPUj . . . 
CPU n ) , wobei jeder mit einem Cache-Speicher (MCj), der in 
5 Blocken der gleichen Kapazitat (bi) angeordnet ist, und 
mit einem Verzeichnis (RGj) und seinem 

Vervaltungsprozessor (PGj) ausgestattet ist, so daB der 
Austausch zwischen Hauptspeicher (RAM) und jedero Prozessor 
(CPUj) iiber den Cache-Speicher (MCj) dieses letzteren 
10 erfolgt, wobei das besagte Verfahren dadurch 
gekennzeichnet ist, daB: 

- jeder Transfer eines inf ormationsblocks (bi) vom Cache- 
Speicher (MCj) eines gegebenen Prozessors (CPUj) zum 
Hauptspeicher (RAM) mit einer Transferfrequenz F von 

15 mindestens 100 Megahertz erfolgt und darin besteht : 

. den Block (bi) des besagten betreffenden 
Cache-Speichers (MCj) zu einem dem besagten Cache-Speicher 
(MCj) zugeordneten Prozessor-Schieberegister (RDPj) von 
der GroBe eines Blocks zu tibertragen, 

20 . den Inhalt des Prozessor-Schieberegisters 

(RDPj) auf einer Serienverbindung (LSj) zu einem Speicher- 
Schieberegister (RDMj) der gleichen Kapazitat zu 
iibertragen, das dem betreffenden Prozessor der an den 
Hauptspeicher (RAM) angeschlossenen Schieberegistern (RDM^ 

25 . . • RDMj . • • RDM n ) zugeordnet ist, 

. innerhalb eines Zyklus des Hauptspeichers den 
Inhalt des Speicher-Schieberegisters (RDMj) zu dem 
besagten Hauptspeicher (RAM) zu libertragen, 

- der Adressentransfer eines Inf ormationsblocks mittels 
30 eines gemeinsamen parallelen AdreBbusses (BUSA) erfolgt. 

23/ - Bauteil fur einen 

Serienmultiportspeicher, das geeignet ist, ein 
Mehrprozessor system nach einem der Anspriiche 1 bis 18 
auszurtisten, dadurch gekennzeichnet, daB es aus einem 
35 integrierten Schaltkreis besteht, der einen Speicher mit 
Zufallsreihenfolgezugriff (RAM) von vorbestimmter Breite, 
die einem Informationsblock (bi) entspricht, aufweist, 
mehrere Schieberegister (RDM^ — RDMj . . . RDM n ) , jedes 
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mit einer Kapazitat, die der Breite des Speichers 
entspricht, einen parallelen internen Bus (BUSI) , der den 
Zugang des Speichers und die Schleberegister miteinander 
verbindet, eine Logik zur Auswahl eines Schieberegisters 
5 (LSR) , die geeignet ist, die Verbindung auf dem internen 
Bus zwischen dem Speicher und einem vorbestimmten 
Schleberegister freizugeben und mehrere externe Eingangs- 
/Ausgangsstifte (adblbc, admot, numreg, cs, wr r rd, 
bitbloc, normal/ config, hi, di) filr den AdreBeingang zum 

10 Speicher (RAM) , fur den AdreBeingang zu der Auswahllogik 
(LSR) , f iir den Eingang und die Freigabe von Lese- oder 
Schreib-Transf erbef ehlen eines Informationsblocks (bi) 
zwischen dem Speicher (RAM) und den Schieberegistern 
(RDMj) , ftir den Eingang eines Taktgeber signals zu jedem 

15 Schleberegister (RDMj ) , f iir den bit-f iir-bit-Eingang eines 
Informationsblocks (bi) zu jedem Schleberegister (RDMj) 
und fiir den bit-fur-bit-Ausgang eines Informationsblocks 
von jedem Schleberegister (RDMj). 

24/ - Bauteil nach Anspruch 23 , dadurch 

20 gekennzeichnet, daB es mindestens ein 

Konfigurationsregister (RC lr RC 2 ...) aufweist, das 
Programmierungseing&nge besitzt, vobei jedes 

Konfigurationsregister mit einer Setzlogik (LF) verbunden 
ist, die an den Speicher (RAM) und an die Schleberegister 

25 (RDMj) angeschlossen ist, um die Zustande des besagten 
Speichers und der besagten Schleberegister zu setzen. 

25y - Bauteil nach Anspruch 24 , das die Wahl 
der GrSBe der verarbeiteten Inf ormationsblocke (bi) 
ermoglicht, dadurch gekennzeichnet, daB: 

30 - der Speicher (RAM) in kombinierbare Bereiche 

unterteilt ist, um die Speicherung der verschiedenen 
moglichen GroBen von Inf ormationsblocken zu ermoglichen, 

- jedes Schleberegister (RDMj) in kombinierbare 
Teilabschnitte unterteilt ist, um das Laden der 

35 verschiedenen moglichen GroBen von Inf ormationsblocken zu 
ermoglichen, mit Abzweigungen, die fiir das jeder GroBe 
entsprechende Verschieben sorgen, 
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der interne Bus (BUS I) mit einer 
Multiplexierlogik (MT) ausgestattet ist, um die Tranfers 
von Informationsblocken (bi) der verschiedenen GroBen 
zwischen den Kombinationen von Speicherbereichen (RAM) und 
5 den entsprechenden Kombinationen der Schieberegister- 
Teilabschnitte (RDMj) zu ermoglichen, 

- ein Konfigurationsreglster (RC^) mit einer 
der Anzahl der moglichen BlockgroBen entsprechenden 
KapazitSt vorgesehen ist, 

10 - die mit dem Register (RC^) verbundene 

Setzlogik (LF) eine Logikeinheit aufveist, die geeignet 
ist, die Multiplexierlogik (MT) zu steuem, um die 
Transfers von Informationsblocken (bi) in einer gegebenen 
GrSBe freizugeben, die dem im Konfigurationsreglster (RC 1 ) 

15 enthaltenen Parameter entspricht. 

26/ Bauteil nach einem der Ansprfiche 24 Oder 
25, dadurch gekennzeichnet, daB: 

- der Eingang und der Ausgang von jedem 
Schieberegister (RDMj) mittels einer Verkntlpfung (PLj) mit 

20 demselben externen Stift verbunden sind, 

- ein Konfigurationsreglster (RC 2 ) mit einer 
der Anzahl der Schieberegister (RDMj) entsprechenden 
Kapazitat vorgesehen ist, 

- die mit dem Konfigurationsreglster (RC 2 ) 
25 verbundene Setzlogik (LF) eine Logikeinheit: aufveist, die 

geeignet ist, die Verkniipfungen (PLj) zu steuern, um die 
Funktionsveise von jedem Schieberegister (RDMj) in den 
Eingangs- Oder Ausgangsmodus zu setzen, und zwar abhSngig 
von einem in dem Konfigurationsreglster (RC 2 ) enthaltenen 
30 Bit, das dem besagten Schieberegister (RDMj) zugeordnet 
ist. 

27/ - Bauteil nach einem der Anspriiche 24, 25 
oder 26, dadurch gekennzeichnet, daB: 

- der Eingang und der Ausgang von jedem 
35 Schieberegister (RDMj) mittels einer Verknvipfung (PLj) mit 

demselben externen Stift verbunden ist, 
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- ein Konf igurationsregister (RC 3 ) mit einer 
der Anzahl von Schieberegistern (RDMj) entsprechenden 
Kapazitat vorgesehen ist, 

- die mit dem Konf igurationsregister (RC 3 ) 
5 verbundene Setzlogik (LF) eine Logikeinheit aufweist, die 

mit der Lese-Steuerung des Speichers (RAM) verbunden ist 
und die geeignet ist, jede Verkniipfung (PLj) zu steuern, 
entweder im Ausgangsmodus beiin Lesen des Speichers 
(Transfer des RAM-Speichers zum entsprechenden Register 

10 RDMj) wahrend der ganzen Dauer des vollstandigen Entladens 
des besagten Schieberegisters (RDMj) oder die restliche 
Zeit im Eingangsmodus . 

28/ - Bauteil nach einem der Ansprilche 24 , 25, 
26 oder 27 , dadurch gekennzeichnet, da£ es einen extemen 

15 Eingangsstift (bit/bloc) aufweist, einen oder mehrere 
exteme Eingangs-/Ausgangsstifte fiir Daten (data) , eine 
Steuerlogik (COM) , die mit dem Eingangsstift (bit/bloc) , 
mit den Eingangs-/Ausgangsstiften (data) , mit dem Speicher 
(RAM) und mit der Auswahllogik (LSR) verbunden ist und die 

20 geeignet ist, je nach* Zustand des Eingangs (bit/bloc), 
entweder die Transfers von Informationsblocken (bi) 
zwischen Speicher (RAM) und Schieberegistern (RDMj) oder 
die Transfers von" Bit direkt zwischen dem Speicher (RAM) 
und den Stiften (data) zu bewirken. 

25 29/ - Bauteil nach den Anspriichen 24 und 28 

zusammen, dadurch gekennzeichnet, daB die 

Konf igurationsregister (RC^ RC 2 ...) verbunden sind: 

- einerseits mit der Auswahllogik (LSR) , die 
geeignet ist, die besagten Konf igurationsregister fiir die 

30 den besagten Registern zugeordneten vorbestimmten Adressen 
auszuwahlen, 

- andererseits, mit der Steuerlogik (COM) , die 
geeignet ist, die von den Eingangs-/Ausgangsstiften (data) 
kommenden Daten zu den besagten Konf igurationsregistern zu 

35 iibertragen, urn diese letzteren zu programmer en. 

30/ - Bauteil nach einem der Ansprtiche 23 bis 
29, in dem auf dem internen Bus (BUSI) , der den Zugang zum 
Speicher (RAM) mit den Schieberegistern (RDM.: ) verbindet, 
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eine Xogik vom Typ "Trommel" (BS) ("barrel shifter") 
zwischengeschaltet ist, die geeignet ist, ein Ringshiften 
auf den Bit von jedem Inf ormationsblock durchzuf lihren , 
wobei die besagte Logik (BS) einen Eingang filr die 
Steuerung des Verschiebungsschritts - in Vorteinheiten - 
besitzt, der an Eingangsstiften (admot) angeschlossen ist. 
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